టెక్స్ట్ నుండి వీడియో సృష్టించడం

టెక్నికల్ రిపోర్ట్ చదవండి ఇప్పుడే మొదలుపెట్టండి

ఈ పేజీలో ఉన్న అన్ని వీడియోలు ఎలాంటి మార్పులు లేకుండా నేరుగా Sora ద్వారా రూపొందించబడ్డాయి.

లోడ్ అవుతోంది…

మేము AIకి కదలికలో ఉన్న భౌతిక ప్రపంచాన్ని అర్థం చేసుకోవడం మరియు సిమ్యులేట్ చేయడం నేర్పిస్తున్నాము, దీని లక్ష్యం నిజమైన ప్రపంచ ఇంటరాక్షన్ అవసరమైన సమస్యలను పరిష్కరించడానికి సహాయపడే మోడల్స్‌ను ట్రైన్ చేయడం.

మా టెక్స్ట్-టు-వీడియో మోడల్ Soraని పరిచయం చేస్తున్నాం. Sora ఒక నిమిషం వరకు ఉన్న వీడియోలను, దృశ్య నాణ్యతను మరియు యూజర్ సూచనలను పాటిస్తూ సృష్టించగలదు.

ప్రాంప్ట్: వెచ్చని నీయాన్ లైట్లు మరియు యానిమేటెడ్ నగర సైన్‌బోర్డులతో నిండిన టోక్యో వీధిలో ఒక స్టైలిష్ మహిళ నడుస్తుంది. ఆమె నల్ల లెదర్ జాకెట్, పొడవైన ఎరుపు రంగు డ్రెస్, నల్ల బూట్లు ధరించి, నల్ల పర్స్ మోసుకుపోతుంది. ఆమె సన్‌గ్లాసెస్, ఎరుపు లిప్‌స్టిక్ వేసుకుంది. ఆమె ఆత్మవిశ్వాసంగా, సహజంగా నడుస్తుంది. ఆ వీధి తడిగా ఉంది మరియు ప్రతిబింబిస్తుంది, రంగురంగుల లైట్లకు అద్దం లాంటి ప్రభావం సృష్టిస్తోంది. చాలా మంది పాదచారులు తిరుగుతున్నారు.

ప్రాంప్ట్: మంచుతో కప్పబడ్డ మైదానంలో కొన్ని భారీ వూలీ మమ్మత్తులు నడుస్తూ దగ్గరకు వస్తున్నాయి. అవి నడుస్తుండగా వాటి పొడవైన వూలీ రోమాలు గాలిలో మృదువుగా ఊగుతున్నాయి. దూరంలో మంచుతో కప్పబడిన చెట్లు, అద్భుతమైన మంచు పర్వతాలు కనిపిస్తున్నాయి. మధ్యాహ్నపు వెలుతురు, పలుచటి మేఘాలు, దూరంలో ఎత్తుగా ఉన్న సూర్యుడు ఒక వెచ్చని కాంతిని సృష్టిస్తున్నాయి. తక్కువ కోణం నుండి తీసిన కెమెరా షాట్ అద్భుతంగా ఆ పెద్ద రోమాల జంతువును లోతైన ఫోటోగ్రఫీతో అందంగా పట్టింది.

ప్రాంప్ట్: ఎరుపు వూల్ నేసిన మోటార్‌సైకిల్ హెల్మెట్ ధరించిన 30 ఏళ్ల స్పేస్‌మ్యాన్ సాహసాలను చూపించే సినిమా ట్రైలర్. నీలి ఆకాశం, ఉప్పు ఎడారి, సినిమాటిక్ స్టైల్, 35మిమీ ఫిల్మ్‌లో షూట్ చేసిన ప్రకాశవంతమైన రంగులతో నిండి ఉంది.

ప్రాంప్ట్: బిగ్ సర్ గారే పాయింట్ బీచ్ వద్ద రౌడ్ క్లిఫ్స్‌పై అలలు గర్జిస్తున్న డ్రోన్ వీక్షణ.పగిలిపడే నీలి అలలు తెల్లని అంచులు కలిగిన తరంగాలను సృష్టిస్తాయి, అస్తమించే సూర్యుని బంగారు కాంతి రాతి తీరాన్ని ప్రకాశవంతం చేస్తుంది. దూరంలో ఒక చిన్న దీవిపై లైట్హౌస్ ఉంది, మరియు పచ్చని పొదలు కొండ అంచును కప్పివేస్తున్నాయి. రోడ్డుపై నుంచి బీచ్‌కి ఉన్న కఠినమైన పతనం నాటకీయంగా కనిపిస్తుంది, సముద్రం పైకి ముందుకు పొడుచుకుపోయిన కొండ అంచులతో. ఇది తీరప్రాంతం యొక్క సహజ సౌందర్యాన్ని మరియు పసిఫిక్ కోస్ట్ హైవే యొక్క కఠినమైన భూభాగాన్ని చూపించే దృశ్యం.

ప్రాంప్ట్: యానిమేటెడ్ సీన్‌లో కరుగుతున్న ఎరుపు కాండిల్ పక్కన మోకాళ్లపై కూర్చున్న చిన్న ఫ్లఫీ మాన్స్టర్ క్లోజ్-అప్‌గా కనిపిస్తుంది. ఆర్ట్ స్టైల్ 3D మరియు రియలిస్టిక్‌గా ఉంది, లైటింగ్ మరియు టెక్స్చర్‌పై దృష్టి సారించి. పెయింటింగ్ యొక్క మూడ్ ఆశ్చర్యం మరియు ఆసక్తిని కలిగించేలా ఉంది, మాన్స్టర్ తన పెద్ద కళ్ళతో మరియు తెరిచిన నోటితో జ్వాలను గమనిస్తున్నట్లు. దాని భంగిమ మరియు హావభావాలు అమాయకత్వం, ఆటపాటల భావనను వ్యక్తం చేస్తాయి, అది మొదటిసారి చుట్టూ ఉన్న ప్రపంచాన్ని అన్వేషిస్తున్నట్లుగా. వేడి రంగులు మరియు నాటకీయ లైటింగ్ వినియోగం ఆ చిత్రంలోని సౌకర్యవంతమైన వాతావరణాన్ని మరింత మెరుగుపరుస్తుంది.

ప్రాంప్ట్: అద్భుతంగా రిండర్ చేయబడిన పేపర్‌క్రాఫ్ట్ ప్రపంచం — రంగురంగుల చేపలు, సముద్ర జీవులతో నిండిన కోరల్ రీఫ్.

ప్రాంప్ట్: విక్టోరియా క్రౌన్డ్ పిజన్ యొక్క ఈ క్లోజ్-అప్ షాట్ దాని ఆకట్టుకునే నీలి రెక్కలు, ఎరుపు ఛాతీని చూపిస్తుంది. దాని కిరీటం సున్నితమైన, లేసీ ఫెదర్స్‌తో తయారై ఉంది, దాని కన్ను ఆకట్టుకునే ఎరుపు రంగులో ఉంది. ఆ పక్షి తలను కొద్దిగా పక్కకు వంచి, గాంభీర్యంగా మరియు రాజసంగా కనిపిస్తున్నట్లుగా భావన ఇస్తోంది. నేపథ్యం బ్లర్‌గా ఉంది, పక్షి యొక్క ఆకట్టుకునే రూపంపై దృష్టిని సారిస్తోంది.

ప్రాంప్ట్: కాఫీ కప్‌లో ప్రయాణిస్తూనే పరస్పరం యుద్ధం చేస్తున్న రెండు పైరేట్ షిప్స్‌ ఫోటోరియలిస్టిక్ క్లోజ్‌అప్ వీడియో.

ప్రాంప్ట్: ఆకాశంలో మేఘం ముక్కపై కూర్చుని, పుస్తకం చదువుతున్న తన 20ల వయసులో ఉన్న ఒక యువకుడు.

ఈ రోజు నుండి, హానులు లేదా ప్రమాదాలను అంచనా వేయడానికి కీలక ప్రాంతాలను పరిశీలించేందుకు Sora‌ను రెడ్ టీమర్లకు అందుబాటులోకి తీసుకువస్తున్నారు.సృజనాత్మక వృత్తిపరులకు అత్యంత ఉపయోగకరంగా మోడల్‌ను అభివృద్ధి చేసేందుకు ఫీడ్‌బ్యాక్ పొందడానికి, అనేక విజువల్ ఆర్టిస్ట్‌లు, డిజైనర్‌లు, ఫిల్మ్‌మేకర్‌లకు కూడా యాక్సెస్‌ని ఇస్తున్నాం.

OpenAI వెలుపల ఉన్న వ్యక్తులతో కలిసి పని చేయడం, ఫీడ్‌బ్యాక్ పొందడం ప్రారంభించడానికి మరియు ప్రజలకు భవిష్యత్తులో AI సామర్థ్యాలు ఏమిటో అర్థమయ్యేలా చేయడానికి, మేము మా రీసెర్చ్ పురోగతిని ముందుగా షేర్ చేస్తున్నాం.

ప్రాంప్ట్: గోల్డ్ రష్ సమయంలో కాలిఫోర్నియా యొక్క హిస్టారికల్ ఫుటేజ్.

ప్రాంప్ట్: జెన్ గార్డెన్ కలిగిన గ్లాస్ స్ఫియర్‌ యొక్క క్లోజ్-అప్ వీక్షణం. ఆ స్ఫియర్‌లో ఒక చిన్న డ్వార్ఫ్ ఉంది, అతను జెన్ గార్డెన్‌ను రేక్ చేస్తూ ఇసుకలో డిజైన్స్ సృష్టిస్తున్నాడు.

ప్రాంప్ట్: 24 ఏళ్ల మహిళ కన్ను మ్రుగమ్రుగలాడుతున్న ఎక్స్‌ట్రీమ్ క్లోజ్-అప్ — ఆమె మాజిక్ అవర్‌లో మారాకేష్‌లో నిలబడి ఉంది. 70మిమీ సినిమాటిక్ ఫిల్మ్ షాట్, డెప్త్ ఆఫ్ ఫీల్డ్, ప్రకాశవంతమైన రంగులు, సినిమాటిక్ స్టైల్.

ప్రాంప్ట్: కార్టూన్ కంగారు డిస్కో డ్యాన్స్ చేస్తోంది.

ప్రాంప్ట్: 2056లో నైజీరియా, లాగోస్ ప్రజలను చూపించే అందమైన హోమ్‌మేడ్ వీడియో. మొబైల్ ఫోన్ కెమెరాతో షూట్ చేయబడింది.

ప్రాంప్ట్: ఒక పెట్రీ డిష్‌లో పెరుగుతున్న బాంబూ ఫారెస్ట్, అందులో చిన్న రెడ్ పాండాలు తిరుగుతున్నాయి.

ప్రాంప్ట్: పెద్ద వింటేజ్ టెలివిజన్‌ల గుట్ట చుట్టూ కెమెరా రొటేట్ అవుతుంది — 1950ల సై-ఫై మూవీస్, హారర్ మూవీస్, న్యూస్, స్టాటిక్, 1970ల సిట్‌కామ్ మొదలైన వివిధ ప్రోగ్రామ్‌లు చూపిస్తూ, ఒక పెద్ద న్యూయార్క్ మ్యూజియం గ్యాలరీలో సెట్ చేయబడింది.

ప్రాంప్ట్: పెద్ద, ఎక్స్‌ప్రెసివ్ కళ్ళతో చిన్న, గుండ్రటి, ఫ్లఫీ క్రియేచర్ ఒక వైబ్రంట్, ఎన్‌చాంటెడ్ ఫారెస్ట్‌ను ఎక్స్ప్లోర్ చేస్తున్న 3D యానిమేషన్. ఆ క్రియేచర్‌ — రాబిట్, స్క్విరెల్‌ల మిశ్రమం — మృదువైన నీలి ఫర్ మరియు గుబురు గీతల తోక కలిగి ఉంది. అది మెరిసే ప్రవాహం వెంట దూకుతూ, ఆశ్చర్యంతో తన కళ్ళను పెద్దవిగా తెరిచి చూస్తుంది. ఆ అరణ్యం మాయా అంసాలతో సజీవంగా ఉంది: ప్రకాశించే మరియు రంగులు మారే పువ్వులు, ఊదా మరియు వెండి రంగు ఆకులు కలిగిన చెట్లు, ఫైర్‌ఫ్లైస్‌లా కనిపించే చిన్న తేలియాడే లైట్లు. ఆ క్రియేచర్ ఒక మష్రూమ్ రింగ్ చుట్టూ డ్యాన్స్ చేస్తున్న చిన్న, ఫెయిరీలా కనిపించే జీవులతో ఆటపాటగా మమేకమవ్వడానికి ఆగుతుంది. అరణ్యం గుండె లాగా కనిపించే ఒక పెద్ద, ప్రకాశించే చెట్టును ఆ క్రియేచర్ ఆశ్చర్యంతో పైకి చూసింది.

Sora అనేక క్యారెక్టర్‌లు, ప్రత్యేకమైన మోషన్‌లు, అలాగే సబ్జెక్ట్ మరియు బ్యాక్‌గ్రౌండ్‌కు సంబంధించిన ఖచ్చితమైన వివరాలతో కూడిన క్లిష్టమైన సీన్లను కూడా రూపొందించగలదు.మోడల్‌కు యూజర్ ప్రాంప్ట్‌లో ఏం కోరాడో మాత్రమే కాదు, ఆ విషయాలు నిజ జీవితంలో ఎలా ఉంటాయో కూడా అర్థమవుతుంది.

ప్రాంప్ట్: కెమెరా ఒక తెల్లని వింటేజ్ SUVని నల్ల రూఫ్ ర్యాక్‌తో వెనుక నుంచి ఫాలో అవుతోంది, అది పైన్ చెట్లతో చుట్టుముట్టిన ఎత్తైన పర్వత పైన ఉన్న మట్టి రోడ్డుపై వేగంగా వెళ్తోంది. టైర్లు ఎగురవేసే దుమ్ము, SUVపై పడే సూర్యకాంతి దృశ్యానికి వెచ్చని కాంతిని ఇస్తోంది. మట్టి రహదారి దూరంలో మెల్లగా వంగుతోంది, చుట్టూ మరే ఇతర కార్లు లేదా వాహనాలు కనిపించడం లేదు. రహదారి రెండు వైపులా రెడ్‌వుడ్స్ చెట్లు ఉన్నాయి, వాటి మధ్యలో ఎక్కడక్కడా పచ్చదనం కనిపిస్తోంది. కారు వెనుక నుంచి కనిపిస్తూ, ఆ వంకర రహదారిని సులభంగా అనుసరిస్తోంది, అది కఠినమైన భూభాగం గుండా రగ్డ్ డ్రైవ్ చేస్తున్నట్లుగా అనిపిస్తోంది. ఆ మట్టి రహదారి చుట్టూ ఎత్తైన కొండలు, పర్వతాలు ఉన్నాయి, పైగా స్వచ్ఛమైన నీలి ఆకాశంలో పలుచటి మేఘాలు తేలియాడుతున్నాయి.

ప్రాంప్ట్: టోక్యో సబర్బ్స్‌ గుండా ప్రయాణిస్తున్న ట్రైన్ కిటికీలో ప్రతిబింబాలు కనిపిస్తున్నాయి.

ప్రాంప్ట్: అమాల్ఫీ కోస్ట్‌లో రాతి అంచుపై నిర్మించబడిన అందమైన చారిత్రక చర్చ్ చుట్టూ డ్రోన్ కెమెరా తిరుగుతోంది. ఈ దృశ్యం చారిత్రకమైన మరియు అద్భుతమైన ఆర్కిటెక్చరల్ డిటైల్స్, టియర్ చేసిన మార్గాలు, పేటియోలను చూపిస్తుంది. క్రింద రాళ్లపై అలలు ఢీకొడుతున్నాయి, దృశ్యం సముద్ర హరిజన్ మరియు అమాల్ఫీ కోస్ట్ ఇటలీ యొక్క కొండల ల్యాండ్‌స్కేప్‌ని చూపిస్తుంది. దూరంలో కొన్ని వ్యక్తులు పేటియోల్లో నడుచుకుంటూ, అద్భుతమైన సముద్ర దృశ్యాలను ఆస్వాదిస్తున్నారు. మధ్యాహ్న సూర్యుని వెచ్చని కాంతి ఈ సన్నివేశానికి మాయాజాలం, రొమాంటిక్ ఫీలింగ్‌ని ఇస్తోంది. ఈ వీక్షణం అద్భుతమైన ఫోటోగ్రఫీతో ఆకర్షణీయంగా పట్టబడింది.

ప్రాంప్ట్: ఒక పెద్ద నారింజ రంగు ఆక్టోపస్ ఇసుక మరియు రాతి భూభాగంతో కలిసిపోయి, సముద్రపు నేలపై విశ్రాంతి తీసుకుంటోంది. దాని టెంటాకిల్స్ శరీరం చుట్టూ విస్తరించి ఉన్నాయి, దాని కళ్ళు మూసుకుపోయాయి. రాయి వెనుక నుంచి క్రాల్ అవుతూ దానివైపు వస్తున్న కింగ్ క్రాబ్ గురించి ఆక్టోపస్‌కి తెలియదు, దాని క్లాజ్ ఎత్తబడి, దాడి చేయడానికి సిద్ధంగా ఉన్నాయి. ఆ క్రాబ్ గోధుమరంగులో, ముళ్లతో, పొడవైన కాళ్లు మరియు యాంటెన్నాలతో ఉంది. ఆ సన్నివేశం వైడ్ యాంగిల్‌లో పట్టబడింది, సముద్రం యొక్క విశాలత మరియు లోతును చూపుతూ. నీరు పారదర్శకంగా, నీలంగా ఉంది, సూర్యరశ్ములు దానిలోంచి ఫిల్టర్ అవుతున్నాయి. ఆ షాట్ శార్ప్‌గా, క్రిస్ప్‌గా ఉంది, హై డైనమిక్ రేంజ్‌తో. ఆక్టోపస్ మరియు క్రాబ్ ఫోకస్‌లో ఉన్నాయి, కానీ బ్యాక్‌గ్రౌండ్ కొద్దిగా బ్లర్‌గా ఉంది, దాంతో డెప్త్ ఆఫ్ ఫీల్డ్ ఎఫెక్ట్ సృష్టించబడింది.

ప్రాంప్ట్: పేపర్ ఎయిర్‌ప్లేన్స్ గుంపు ఒక ఘనమైన జంగిల్‌లో చెట్ల చుట్టూ నూలుపోగులు వేసుకుంటూ, వలస పక్షుల్లా ఎగురుతోంది.

ప్రాంప్ట్: ఒక పిల్లి, తన నిద్రలో ఉన్న యజమానిని లేపుతూ, బ్రేక్‌ఫాస్ట్‌ కోసం డిమాండ్ చేస్తోంది. యజమాని పిల్లిని పట్టించుకోకుండా ఉండటానికి ప్రయత్నిస్తాడు, కానీ పిల్లి కొత్త టాక్టిక్స్ ప్రయత్నిస్తుంది, చివరికి యజమాని దిండు క్రింద దాచిన ట్రీట్స్‌ను బయటకు తీసి, పిల్లిని కొంతసేపు దూరంగా ఉంచుతాడు.

ప్రాంప్ట్: కినాబటాంగన్ నది వద్ద బోర్నియో వైల్డ్‌లైఫ్

ప్రాంప్ట్: చైనీస్ లూనర్ న్యూ ఇయర్ సెలబ్రేషన్ వీడియో — చైనీస్ డ్రాగన్‌తో.

ఈ మోడల్‌కి భాషపై లోతైన అవగాహన ఉంది, దాంతో ప్రాంప్ట్‌లను ఖచ్చితంగా అర్థం చేసుకుని, స్పష్టమైన భావోద్వేగాలను వ్యక్తం చేసే ఆకట్టుకునే క్యారెక్టర్లను సృష్టించగలదు. Sora ఒకే జనరేటెడ్ వీడియోలో అనేక షాట్స్ సృష్టించగలదు, అవి క్యారెక్టర్లను మరియు విజువల్ స్టైల్‌ను ఖచ్చితంగా కొనసాగిస్తాయి.

ప్రాంప్ట్: అనేక అందమైన కళాకృతులు, వేర్వేరు స్టైల్‌లలో ఉన్న ఒక ఆర్ట్ గ్యాలరీ టూర్.

ప్రాంప్ట్: అందమైన, మంచుతో కప్పబడిన టోక్యో నగరం రద్దీగా ఉంది. కెమెరా రద్దీగా ఉన్న నగర వీధిలో కదులుతూ, అందమైన మంచు వాతావరణాన్ని ఆస్వాదిస్తూ సమీపంలోని స్టాల్స్‌లో షాపింగ్ చేస్తున్న పలువురిని ఫాలో అవుతోంది. అద్భుతమైన సకురా రేకులు మంచు తుంపరలతో పాటు గాలిలో ఎగురుతున్నాయి.

ప్రాంప్ట్: సబర్బన్ హౌస్ విండోసిల్‌ నుంచి పెరుగుతున్న పువ్వు యొక్క స్టాప్ మోషన్ యానిమేషన్.

ప్రాంప్ట్: సైబర్‌పంక్ సెట్టింగ్‌లో ఒక రోబోట్ జీవిత కథ.

ప్రాంప్ట్: తన 60వ దశకంలో ఉన్న, గడ్డం పెట్టుకున్న బూడిదరంగు జుట్టు గల మనిషి యొక్క ఎక్స్‌ట్రీమ్ క్లోజ్‌అప్ — అతను పారిస్‌లోని ఒక కేఫేలో కూర్చుని విశ్వ చరిత్రను ఆలోచనలో మునిగిపోయి ఉన్నాడు. అతని కళ్ళు ఆఫ్‌స్క్రీన్‌లో నడుస్తున్న ప్రజలపై కేంద్రీకరించబడ్డాయి, అతను ఎక్కువగా కదలకుండా కూర్చున్నాడు. వూల్ కోట్, సూట్ కోట్, బటన్‌డౌన్ షర్ట్ ధరించాడు, బ్రౌన్ బెరెట్, గ్లాసెస్ వేసుకున్నాడు, అతనికి ప్రొఫెసర్‌లా కనిపించే రూపం ఉంది. చివర్లో అతను మూసిన నోటితో సన్నని చిరునవ్వు ఇస్తాడు, జీవన రహస్యానికి సమాధానం దొరికినట్లుగా. లైటింగ్ చాలా సినిమాటిక్‌గా ఉంది — బంగారు వెలుతురుతో, నేపథ్యంగా పారిసియన్ వీధులు మరియు నగరం, డెప్త్ ఆఫ్ ఫీల్డ్, సినిమాటిక్ 35మిమీ ఫిల్మ్‌తో.

ప్రాంప్ట్: ఒక అందమైన సిల్హౌట్ యానిమేషన్‌లో ఒక వృకుడు చంద్రుని వైపు అరిస్తూ, ఒంటరితనం అనుభవిస్తూ, చివరికి తన గుంపును కనుగొంటాడు.

ప్రాంప్ట్: అట్లాంటిస్‌లా మునిగిపోయిన న్యూయార్క్ సిటీ. న్యూయార్క్ వీధుల్లో చేపలు, తిమింగలాలు, సముద్ర తాబేళ్లు, షార్క్‌లు ఈదుతున్నాయి.

ప్రాంప్ట్: మంచులో ఆడుకుంటున్న గోల్డెన్ రిట్రీవర్ పిల్ల కుక్కల గుంపు. వాటి తలలు మంచు లోపల నుంచి బయటకు పొంగి వస్తాయి, మంచుతో కప్పబడి.

ప్రస్తుత మోడల్‌లో ఇంకా మెరుగుదలకు స్థలం ఉంది. సంక్లిష్టమైన సన్నివేశం యొక్క ఫిజిక్స్‌ను సిమ్యులేట్ చేయడంలో ఇది ఇబ్బంది పడవచ్చు, మరియు కారణం-ప్రభావం వంటి నిర్దిష్ట సందర్భాలను అర్థం చేసుకోకపోవచ్చు (ఉదాహరణకు: ఒక క్యారెక్టర్ కుకీని కొరుకుతున్న తర్వాత దానిపై గుర్తు కనిపించకపోవచ్చు). మోడల్ ప్రాంప్ట్‌లోని స్థల సంబంధిత వివరాలను కూడా గందరగోళం చేయవచ్చు, ఉదాహరణకు ఎడమను కుడితో వేరుచేయడం, లేదా కాలంతో పాటు జరిగే ఘటనల సరిగ్గా వివరాలను, ఉదాహరణకు ప్రత్యేక క్యామరా మార్గాలను సరిగ్గా వివరిస్తూ సమస్యను ఎదుర్కోవచ్చు.

ప్రాంప్ట్: ఒక వ్యక్తి పరుగెత్తుతున్న స్టెప్-ప్రింటింగ్ సీన్, సినిమాటిక్ ఫిల్మ్ 35మిమీ షాట్‌లో.

బలహీనత: Sora కొన్ని సార్లు భౌతికంగా అసాధ్యమైన మోషన్‌ను సృష్టిస్తుంది.

ప్రాంప్ట్: గడ్డి చుట్టూ ఉన్న దూరమైన గ్రావెల్ రోడ్డుపై ఐదు గ్రే వుల్ఫ్ పప్స్ ఒకరినొకరు వెంటాడుతూ, ఆటపాటలాడుతున్నాయి. ఆ పప్స్ పరుగెత్తుతూ, దూకుతూ, ఒకరినొకరు వెంటాడుతూ, కొరుక్కుంటూ, ఆడుకుంటున్నాయి.

బలహీనత: జంతువులు లేదా మనుషులు అకస్మాత్తుగా ప్రత్యక్షమవుతారు, ముఖ్యంగా అనేక ఎంటిటీలతో కూడిన సన్నివేశాల్లో.

ప్రాంప్ట్: బాస్కెట్‌బాల్ హూప్ గుండా వెళ్లి తర్వాత పేలిపోతుంది.

బలహీనత: తప్పైన ఫిజికల్ మోడలింగ్ మరియు సహజం కాని ఆబ్జెక్ట్ “మార్ఫింగ్” కి ఒక ఉదాహరణ.

ప్రాంప్ట్: ఆర్కియాలజిస్టులు ఎడారిలో ఒక సాధారణ ప్లాస్టిక్ కుర్చీని కనుగొంటారు, దాన్ని జాగ్రత్తగా తవ్వి, దుమ్ము తుడుస్తారు.

బలహీనత: ఈ ఉదాహరణలో, కుర్చీని రిజిడ్ ఆబ్జెక్ట్‌గా మోడల్ చేయడంలో Sora విఫలమవుతుంది, దాంతో తప్పైన భౌతిక పరస్పర చర్యలు జరుగుతాయి.

ప్రాంప్ట్: శుభ్రంగా దువ్విన బూడిదరంగు జుట్టుతో ఉన్న అమ్మమ్మ, చెక్క డైనింగ్ టేబుల్‌పై అనేక కొవ్వొత్తులతో ఉన్న రంగురంగుల బర్త్‌డే కేక్ వెనుక నిలబడి ఉంది. ఆమె ముఖంలో నిండైన సంతోషం, ఆనందం ప్రతిబింబిస్తున్నాయి, కళ్ళలో ఆనందపు కాంతి మెరిసిపోతోంది. ఆమె ముందుకు వాలి, మృదువుగా ఊదుతూ కొవ్వొత్తులను ఆర్పుతుంది. కేక్‌పై పింక్ ఫ్రాస్టింగ్, స్ప్రింకిల్స్ ఉన్నాయి, కొవ్వొత్తులు ఆగిపోతాయి. అమ్మమ్మ పూల డిజైన్స్‌తో అలంకరించిన లైట్ బ్లూ బ్లౌజ్ ధరించింది. టేబుల్ దగ్గర కూర్చున్న ఆనందంగా ఉన్న స్నేహితులు, కుటుంబసభ్యులు కూడా సెలబ్రేట్ చేస్తున్నారు, అవి అవుట్ ఆఫ్ ఫోకస్‌లో కనిపిస్తున్నాయి. ఆ సన్నివేశం అందంగా, సినిమాటిక్‌గా పట్టబడింది — అమ్మమ్మను మరియు డైనింగ్ రూమ్‌ను 3/4 వ్యూలో చూపిస్తోంది. వెచ్చని రంగుల టోన్స్ మరియు సాఫ్ట్ లైటింగ్ ఆ వాతావరణాన్ని మరింత మెరుగుపరుస్తున్నాయి.

బలహీనత: ఆబ్జెక్ట్‌లు మరియు అనేక క్యారెక్టర్ల మధ్య సంక్లిష్ట పరస్పర చర్యలను సిమ్యులేట్ చేయడం మోడల్‌కు తరచుగా సవాలుగా ఉంటుంది, కొన్నిసార్లు అవి హాస్యాస్పదమైన ఫలితాలను ఇస్తాయి.

సేఫ్టీ

Soraని OpenAI ప్రొడక్ట్స్‌లో అందుబాటులోకి తేవడానికి ముందుగా మేము అనేక ముఖ్యమైన సేఫ్టీ చర్యలు తీసుకుంటాము. మేము రెడ్ టీమర్స్‌తో — మిస్ఇన్ఫర్మేషన్, హేట్ఫుల్ కాంటెంట్, బైయాస్ వంటి రంగాల్లో డొమైన్ ఎక్స్‌పర్ట్స్‌తో — కలిసి పనిచేస్తున్నాం. వారు మోడల్‌ను ఎడ్వర్సేరియల్‌గా టెస్ట్ చేస్తారు.

మభ్యపెట్టే కంటెంట్‌ను గుర్తించడానికి సహాయపడే టూల్స్‌ను కూడా మేము రూపొందిస్తున్నాం, ఉదాహరణకు వీడియో Sora ద్వారా రూపొందించబడిందో లేదో చెప్పగల డిటెక్షన్ క్లాసిఫైయర్‌.OpenAI ప్రొడక్ట్‌లో మోడల్‌ను విడుదల చేసినప్పుడు భవిష్యత్తులో C2PA metadata⁠(కొత్త విండోలో తెరుచుకుంటుంది)ను కూడా చేర్చాలని మా ప్లాన్.

మేము విస్తరణ కోసం సిద్ధం చేయడానికి కొత్త పద్ధతులను అభివృద్ధి చేయడంతో పాటు, DALL·E 3 ను ఉపయోగించే మా ప్రొడక్ట్‌ల కోసం మేము నిర్మించిన ఇప్పటికే ఉన్న భద్రతా పద్ధతులను⁠(కొత్త విండోలో తెరుచుకుంటుంది) ఉపయోగిస్తున్నాము, ఇవి Sora కు కూడా వర్తిస్తాయి.

ఉదాహరణకు, ఒకసారి OpenAI ప్రొడక్ట్‌లో వాడినప్పుడు, మా టెక్స్ట్ క్లాసిఫైయర్ మా యూజేజ్ పాలిసీలకు విరుద్ధంగా ఉన్న టెక్స్ట్ ఇన్‌పుట్ ప్రాంప్ట్‌లను చెక్ చేసి తిరస్కరిస్తుంది — ఉదా: తీవ్ర హింస, సెక్సువల్ కాంటెంట్, హేట్ఫుల్ ఇమేజరీ, సెలబ్రిటీ లైక్నెస్, లేదా ఇతరుల IP కోసం చేసిన అభ్యర్థనలు. యూజర్‌కి చూపే ముందు ప్రతి జనరేటెడ్ వీడియో ఫ్రేమ్‌లను రివ్యూ చేయడానికి, మా యూజేజ్ పాలిసీలకు అనుగుణంగా ఉందని నిర్ధారించడానికి మేము రాబస్ట్ ఇమేజ్ క్లాసిఫైయర్‌లను కూడా అభివృద్ధి చేశాం.

ఈ కొత్త టెక్నాలజీకి సంబంధించి వారి ఆందోళనలు అర్థం చేసుకోవడానికి, సానుకూల యూజ్ కేసులను గుర్తించడానికి ప్రపంచవ్యాప్తంగా పాలిసీ మేకర్స్, ఎడ్యుకేటర్స్, ఆర్టిస్టులతో మేము మమేకమవుతాం. విస్తృతమైన రీసెర్చ్ మరియు టెస్టింగ్ చేసినప్పటికీ, ప్రజలు మా టెక్నాలజీని ఉపయోగించే అన్ని ప్రయోజనకరమైన మార్గాలను, లేదా దాన్ని దుర్వినియోగం చేసే అన్ని మార్గాలను మేము అంచనా వేయలేము. అందుకే, కాలక్రమేణా మరింత సురక్షితమైన AI సిస్టమ్స్ సృష్టించడం మరియు విడుదల చేయడంలో వాస్తవిక-ప్రపంచ వినియోగం నుండి నేర్చుకోవడం ఒక కీలకమైన అంశమని మేము నమ్ముతున్నాం.

ప్రాంప్ట్: కెమెరా బురానో, ఇటలీలోని రంగురంగుల భవనాలను నేరుగా ఎదుర్కొంటోంది. ఒక అందమైన డాల్మేషన్ గ్రౌండ్ ఫ్లోర్‌లోని బిల్డింగ్ కిటికీ ద్వారా బయట చూస్తోంది. భవనాల ముందు ఉన్న కాలువ వీధుల వెంట చాలా మంది నడుస్తూ, సైక్లింగ్ చేస్తూ కనిపిస్తున్నారు.

ప్రాంప్ట్: ఒక అందమైన, సంతోషంగా ఉన్న ఓటర్ పసుపు లైఫ్‌జాకెట్ ధరించి, సర్ఫ్‌బోర్డ్‌పై ధైర్యంగా నిలబడి ఉంది. అది ఆకుపచ్చని ట్రాపికల్ దీవుల దగ్గర, టర్కాయిస్ రంగు సముద్రజలాలపై సర్ఫ్ చేస్తోంది. 3D డిజిటల్ రెండర్ ఆర్ట్ స్టైల్‌లో.

ప్రాంప్ట్: ఈ క్లోజ్-అప్ షాట్‌లో ఒక కమీలియన్ తన ఆకట్టుకునే కలర్‌చేంజ్ సామర్థ్యాలను ప్రదర్శిస్తోంది. నేపథ్యం బ్లర్‌గా ఉంది, జంతువు యొక్క ఆకట్టుకునే రూపంపై దృష్టిని సారిస్తోంది.

ప్రాంప్ట్: ట్రాపికల్ మావీలో ఒక కార్గి తనను తాను వ్లోగ్ చేస్తోంది.

ప్రాంప్ట్: తెల్ల మరియు నారింజ రంగు టాబీ పిల్లి ఒక ఘనమైన గార్డెన్‌లో ఏదో వెంబడిస్తున్నట్లుగా సంతోషంగా పరుగెత్తుతోంది. అది ముందుకు జాగ్ చేస్తూ, తన పెద్దవైన సంతోషకరమైన కళ్ళతో కొమ్మలు, పూలు, ఆకులను పరిశీలిస్తోంది. అన్ని మొక్కల మధ్యలో దారిని చేసుకుంటూ వెళ్తున్నప్పుడు ఆ మార్గం సన్నగా ఉంటుంది. ఈ సన్నివేశం గ్రౌండ్-లెవెల్ యాంగిల్‌లో పట్టబడింది, పిల్లిని దగ్గరగా ఫాలో అవుతూ, లోతైన వ్యక్తిగత దృక్కోణాన్ని ఇస్తోంది. ఆ ఇమేజ్ సినిమాటిక్‌గా ఉంది, వెచ్చని టోన్స్ మరియు గ్రెయినీ టెక్స్చర్‌తో. పై ఆకులు మరియు మొక్కల మధ్యనుంచి పడే చెల్లాచెదురైన డేలైట్ ఒక వెచ్చని కాంట్రాస్ట్‌ను సృష్టిస్తోంది, పిల్లి యొక్క నారింజ ఫర్‌ను హైలైట్ చేస్తూ. ఆ షాట్ క్లియర్‌గా, శార్ప్‌గా ఉంది, షాలో డెప్త్ ఆఫ్ ఫీల్డ్‌తో.

ప్రాంప్ట్: బ్లూ అవర్ సమయంలో సాంటోరిని యొక్క ఏరియల్ వ్యూ — నీలి గోపురాలతో తెల్లని సైక్లాడిక్ భవనాల అద్భుతమైన ఆర్కిటెక్చర్‌ను చూపిస్తోంది. కాల్డెరా దృశ్యాలు ఊపిరి తీసుకునేంత అద్భుతంగా ఉన్నాయి, లైటింగ్ ఒక అందమైన, ప్రశాంత వాతావరణాన్ని సృష్టిస్తోంది.

ప్రాంప్ట్: వర్కర్స్, ఎక్విప్‌మెంట్, హెవీ మషినరీతో నిండిన కన్‌స్ట్రక్షన్ సైట్ యొక్క టిల్ట్‌షిఫ్ట్.

ప్రాంప్ట్: ఒక భారీ, ఎత్తైన మేఘం మనిషి ఆకారంలో భూమిపై తేలియాడుతోంది. ఆ మేఘ మనిషి భూమిపైకి లైట్నింగ్ బోల్ట్స్ విసురుతున్నాడు.

ప్రాంప్ట్: ఒక సమోయెడ్ మరియు ఒక గోల్డెన్ రిట్రీవర్ కుక్క రాత్రి ఫ్యూచరిస్టిక్ నియాన్ సిటీలో ఆటపాటగా పరుగెత్తుతున్నాయి. సమీప భవనాల నుంచి వెలువడుతున్న నియాన్ లైట్లు వాటి ఫర్‌పై మెరిసిపోతున్నాయి.

ప్రాంప్ట్: స్కాట్లాండ్, UKలోని గ్లెన్‌ఫిన్నాన్ వైడక్ట్ ఒక చారిత్రక రైల్వే బ్రిడ్జ్, ఇది మల్లైగ్ మరియు ఫోర్ట్ విలియం పట్టణాల మధ్య వెస్ట్ హైలాండ్ లైన్‌ను దాటుతుంది. ఆర్చ్‌లతో కప్పబడిన వైడక్ట్‌పై స్టీమ్ ట్రైన్ వెళ్తూ బ్రిడ్జ్‌ను దాటుతున్న దృశ్యం అద్భుతంగా ఉంటుంది. పచ్చని సస్యశ్యామలత మరియు రాతి పర్వతాలతో నిండిన ల్యాండ్‌స్కేప్, రైలు ప్రయాణానికి ఒక అందమైన నేపథ్యాన్ని సృష్టిస్తోంది. ఆకాశం నీలంగా ఉంది, సూర్యుడు ప్రకాశిస్తున్నాడు — ఈ మహోన్నత స్థలాన్ని అన్వేషించడానికి అద్భుతమైన రోజు.

రీసెర్చ్ టెక్నిక్స్

Sora ఒక డిఫ్యూజన్ మోడల్, ఇది మొదట స్టాటిక్ నాయిస్‌లా కనిపించే వీడియోతో ప్రారంభించి, అనేక స్టెప్‌లలో నాయిస్‌ను తీసేస్తూ నెమ్మదిగా నిజమైన వీడియోగా మార్చుతుంది.

Sora ఒకేసారి మొత్తం వీడియోలను సృష్టించగలదు లేదా ఇప్పటికే సృష్టించిన వీడియోలను పొడిగించగలదు. మోడల్‌కి ఒకేసారి అనేక ఫ్రేమ్‌ల ఫోర్‌సైట్ ఇవ్వడం ద్వారా, సబ్జెక్ట్ తాత్కాలికంగా ఫ్రేమ్ వెలుపలకి వెళ్లినా అది స్థిరంగా ఉండేలా చేసే సవాళ్లను మేము పరిష్కరించాం.

GPT మోడల్స్‌లాగే, Sora ట్రాన్స్‌ఫార్మర్ ఆర్కిటెక్చర్‌ను ఉపయోగిస్తుంది, దీని వల్ల ఉన్నతమైన స్కేలింగ్ పనితీరు సాధ్యమవుతుంది.

వీడియోలు మరియు ఇమేజ్‌లను చిన్న డేటా యూనిట్‌ల సమూహాలుగా చూపిస్తాం. వీటిని ప్యాచ్‌లు అని అంటారు. ప్రతి ప్యాచ్, GPTలో ఉండే ఒక టోకెన్ లానే పనిచేస్తుంది.డేటాను చూపించే విధానాన్ని ఒకటిగా చేసుకోవడం వల్ల, వివిధ వ్యవధులు, రెసల్యూషన్‌లు, ఆస్పెక్ట్ రేషియోలను కవర్ చేసే విస్తృతమైన విజువల్ డేటాపై డిఫ్యూజన్ ట్రాన్స్‌ఫార్మర్‌లను ఇప్పటివరకు సాధ్యం కానంతగా ట్రైన్ చేయగలుగుతున్నాం.

Sora, DALL·E మరియు GPT మోడల్స్‌లోని గత రీసెర్చ్‌పై నిర్మించబడింది. ఇది DALL·E 3లోని రీక్యాప్షనింగ్ టెక్నిక్‌ని ఉపయోగిస్తుంది, ఇది విజువల్ ట్రైనింగ్ డేటాకు అత్యంత వివరణాత్మకమైన క్యాప్షన్‌లను సృష్టించడాన్ని కలిగి ఉంటుంది. దాని ఫలితంగా, జనరేటెడ్ వీడియోలో యూజర్ టెక్స్ట్ సూచనలను మోడల్ మరింత ఖచ్చితంగా అనుసరిస్తుంది.

టెక్స్ట్ ఇన్‌స్ట్రక్షన్‌లతోనే వీడియోను రూపొందించగల సామర్థ్యంతో పాటు, ఈ మోడల్ ఇప్పటికే ఉన్న స్టిల్ ఇమేజ్‌ను తీసుకుని దాని ఆధారంగా వీడియోను కూడా సృష్టించగలదు. ఇమేజ్‌లోని కంటెంట్‌ను చిన్న వివరాల వరకూ ఖచ్చితంగా యానిమేట్ చేస్తుంది.మోడల్ ఇప్పటికే ఉన్న వీడియోని తీసుకుని దాన్ని పొడిగించగలదు లేదా మిస్సింగ్ ఫ్రేమ్‌లను నింపగలదు. మా సాంకేతిక రిపోర్టులో మరింత తెలుసుకోండి⁠.

రియల్ వరల్డ్‌ని అర్థం చేసుకుని సిమ్యులేట్ చేయగల మోడల్స్‌కి Sora ఒక ఫౌండేషన్‌గా పనిచేస్తుంది, ఈ సామర్థ్యం AGI సాధించడంలో ఒక ముఖ్యమైన మైలురాయిగా మేము నమ్ముతున్నాం.

లోడ్ అవుతోంది...