2026 წლის 26 აპრილის მდგომარეობით, Sora პროდუქტი აღარ არის ხელმისაწვდომი.
დღეს ვუშვებთ Sora 2-ს, ჩვენს ფლაგმანურ ვიდეოსა და აუდიოს გენერაციის მოდელს.
2024 წლის თებერვლის ორიგინალური Sora მოდელი ბევრ მხრივ ვიდეოსთვის GPT‑1‑ის მომენტი იყო — პირველი შემთხვევა, როცა ვიდეოგენერაციამ მართლაც სამუშაოს მსგავსი იერი მიიღო და მასშტაბურად გაზრდილი წინასწარი სწავლების გამოთვლითი რესურსის შედეგად გაჩნდა ისეთი მარტივი ქცევები, როგორიცაა ობიექტის მდგრადობა. მას შემდეგ Sora გუნდი ფოკუსირებულია ისეთი მოდელების გაწვრთნაზე, რომლებსაც სამყაროს სიმულაციის უფრო განვითარებული შესაძლებლობები აქვთ. გვჯერა, რომ ასეთი სისტემები კრიტიკულად მნიშვნელოვანი იქნება ისეთი AI მოდელების გასაწვრთნელად, რომლებიც ფიზიკურ სამყაროს ღრმად გაიგებენ. ამის მნიშვნელოვანი ეტაპია ფართომასშტაბიან ვიდეომონაცემებზე წინასწარი და შემდგომი სწავლების დაუფლება, რაც ენასთან შედარებით ჯერ კიდევ საწყის ეტაპზეა.
Prompt: figure skater performs a triple axle with a cat on her head
Sora 2-ით პირდაპირ იმ ეტაპზე გადავდივართ, რომელსაც, ვფიქრობთ, ვიდეოსთვის GPT‑3.5‑ის მომენტი შეიძლება ეწოდოს. Sora 2-ს შეუძლია ისეთი რამეები, რომლებიც წინა ვიდეოგენერაციის მოდელებისთვის განსაკუთრებულად რთულია — და ზოგ შემთხვევაში სრულიად შეუძლებელიც: ოლიმპიური ტანვარჯიშის ილეთები, საპადლებორდოზე უკუსვლითი სალტოები, რომლებიც ზუსტად ასახავს ამოტივტივებისა და სიმყარეს დინამიკას, და სამმაგი აქსელები მაშინ, როცა კატას სიცოცხლის ფასად უჭირავს თავი.
Prompt: a guy does a backflip
წინა ვიდეომოდელები ზედმეტად ოპტიმისტურია — ისინი ტექსტური მოთხოვნის შესასრულებლად ობიექტებს გარდაქმნიან და რეალობას ამახინჯებენ. მაგალითად, თუ კალათბურთელი სროლას ააცილებს, ბურთი შეიძლება სპონტანურად კალათში ტელეპორტირდეს. Sora 2-ში, თუ კალათბურთელი სროლას ააცილებს, ბურთი დაფას მოხვდება და უკუგდებას გააკეთებს. საინტერესოა, რომ „შეცდომები“, რომლებსაც მოდელი უშვებს, ხშირად ჰგავს იმ შინაგანი აგენტის შეცდომებს, რომელსაც Sora 2 ირიბად მოდელირებს; მიუხედავად იმისა, რომ ჯერ კიდევ არასრულყოფილია, წინა სისტემებთან შედარებით ფიზიკის კანონებს უკეთ ემორჩილება. ეს უკიდურესად მნიშვნელოვანი შესაძლებლობაა ნებისმიერი სასარგებლო სამყაროს სიმულატორისთვის — უნდა შეგეძლოს წარუმატებლობის მოდელირებაც და არა მხოლოდ წარმატების.
მოდელი ასევე დიდი ნახტომია წინ კონტროლირებადობის მხრივ — მას შეუძლია ზუსტად დაიცვას რთული ინსტრუქციები, რომლებიც მრავალ კადრს მოიცავს, და ამავე დროს სამყაროს მდგომარეობა ზუსტად შეინარჩუნოს. ის გამოირჩევა რეალისტურ, კინემატოგრაფიულ და ანიმე სტილებში.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
როგორც ზოგადი დანიშნულების ვიდეო-აუდიო გენერაციის სისტემას, მას შეუძლია მაღალი რეალისტურობით შექმნას დახვეწილი ფონური ხმოვანი პეიზაჟები, მეტყველება და ხმოვანი ეფექტები.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
ასევე შეგიძლიათ Sora 2-ში რეალური სამყაროს ელემენტები პირდაპირ ჩასვათ. მაგალითად, ჩვენი ერთ-ერთი თანაგუნდელის ვიდეოზე დაკვირვებით, მოდელს შეუძლია ის ნებისმიერ Sora-გენერირებულ გარემოში ჩასვას გარეგნობისა და ხმის ზუსტი გადმოცემით. ეს შესაძლებლობა ძალიან ზოგადია და მუშაობს ნებისმიერი ადამიანის, ცხოველის თუ ობიექტისთვის.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
მოდელი სრულყოფილი ჯერ კიდევ არ არის და ბევრ შეცდომას უშვებს, თუმცა ეს ადასტურებს, რომ ვიდეომონაცემებზე ნეირონული ქსელების შემდგომი მასშტაბირება რეალობის სიმულაციასთან უფრო დაგვაახლოებს.
ზოგადი დანიშნულების სიმულაციისა და ისეთი AI სისტემებისკენ მიმავალ გზაზე, რომლებსაც ფიზიკურ სამყაროში ფუნქციონირება შეუძლიათ, ვფიქრობთ, ადამიანებს ბევრი სიამოვნების მიღება შეუძლიათ იმ მოდელებით, რომლებსაც ამ გზაზე ვქმნით.
Sora გუნდში ამ „ატვირთე საკუთარი თავი“ ფუნქციით პირველად რამდენიმე თვის წინ დავიწყეთ თამაში და ამან ყველანი აღგვაფრთოვანა. ეს თითქოს კომუნიკაციის ბუნებრივ ევოლუციას ჰგავდა — ტექსტური შეტყობინებებიდან ემოჯებამდე, ხმოვან ჩანაწერებამდე და შემდეგ აქამდე.
ამიტომ დღეს ვუშვებთ ახალ სოციალურ iOS აპს, რომელსაც უბრალოდ „Sora“ ჰქვია, და რომელსაც Sora 2 ამუშავებს. აპის შიგნით შეგიძლიათ შექმნათ ვიდეოები, ერთმანეთის გენერაციები გადააკეთოთ, აღმოაჩინოთ ახალი ვიდეოები მორგებად Sora ფიდში და საკუთარი თავი ან მეგობრები დაამატოთ ფუნქციით, რომელსაც „პერსონაჟები“ ჰქვია. პერსონაჟების მეშვეობით, იდენტობის დასადასტურებლად და თქვენი იერის დასაფიქსირებლად აპში ერთჯერადი მოკლე ვიდეო-აუდიო ჩაწერის შემდეგ, შეგიძლიათ საკუთარი თავი საოცარი სიზუსტით პირდაპირ ნებისმიერ Sora სცენაში ჩასვათ.
გასულ კვირას აპი OpenAI-ის ყველა თანამშრომლისთვის შიდა გამოყენებაში გავუშვით. კოლეგებისგან უკვე მოვისმინეთ, რომ ამ ფუნქციის წყალობით კომპანიაში ახალ მეგობრებს იძენენ. ვფიქრობთ, ამ „პერსონაჟების“ ფუნქციაზე აგებული სოციალური აპი Sora 2-ის მაგიის განსაცდელად საუკეთესო გზაა.
doomscrolling-ის, დამოკიდებულების, იზოლაციისა და RL-ით ოპტიმიზებული ფიდების შესახებ შეშფოთება ჩვენთვის ძალიან მნიშვნელოვანია — აი რას ვაკეთებთ ამის საპასუხოდ.
მომხმარებლებს ვაძლევთ ინსტრუმენტებს და არჩევანის თავისუფლებას, რომ თავად აკონტროლონ, რას ხედავენ ფიდში. OpenAI-ის არსებული დიდი ენობრივი მოდელების გამოყენებით, შევიმუშავეთ რეკომენდაციის ალგორითმების ახალი კლასი, რომლის მართვაც ბუნებრივი ენით გაცემული ინსტრუქციებით შეიძლება. ასევე გვაქვს ჩაშენებული მექანიზმები, რომლებიც პერიოდულად ეკითხება მომხმარებლებს მათ კეთილდღეობაზე და პროაქტიულად სთავაზობს ფიდის მორგების შესაძლებლობას.
ნაგულისხმევად გაჩვენებთ კონტენტს, რომელიც ძლიერ არის მიკერძოებული იმ ადამიანებისკენ, რომლებსაც მისდევთ ან რომლებთანაც ურთიერთობთ, და პრიორიტეტს ვანიჭებთ იმ ვიდეოებს, რომლებიც, მოდელის აზრით, ყველაზე მეტად გამოგადგებათ საკუთარი ნამუშევრების შთაგონებისთვის. ჩვენ არ ვოპტიმიზებთ ფიდში გატარებულ დროს და აპი შეგნებულად ისე შევქმენით, რომ მაქსიმუმამდე აიყვანოს შექმნა, და არა მოხმარება. მეტი დეტალი შეგიძლიათ ნახოთ ჩვენს ფიდის ფილოსოფიაში
ეს აპი თქვენს მეგობრებთან ერთად გამოსაყენებლადაა შექმნილი. ტესტერების overwhelmingly პოზიტიური გამოხმაურება გვიჩვენებს, რომ სწორედ პერსონაჟები ხდის ამ ყველაფერს განსხვავებულსა და სახალისოს — უნდა სცადოთ, რომ ბოლომდე გაიგოთ, მაგრამ ეს ადამიანებთან კომუნიკაციის ახალი და უნიკალური გზაა. ამას მოსაწვევებზე დაფუძნებულ აპად ვუშვებთ, რათა თქვენს მეგობრებთან ერთად შემოხვიდეთ. იმ დროს, როცა ყველა მთავარი პლატფორმა სოციალური გრაფისგან შორდება, ვფიქრობთ, პერსონაჟები გააძლიერებს საზოგადოებას.
თინეიჯერების კეთილდღეობის დაცვა ჩვენთვის მნიშვნელოვანია. ვაწესებთ ნაგულისხმევ ლიმიტებს, თუ რამდენი გენერაციის ნახვა შეუძლიათ თინეიჯერებს ფიდში დღეში, და ამ ჯგუფისთვის პერსონაჟებზე უფრო მკაცრ ნებართვებსაც ვნერგავთ. ჩვენი ავტომატიზებული უსაფრთხოების სისტემების გარდა, ვზრდით ადამიან მოდერატორთა გუნდებს, რათა ბულინგის შემთხვევები, თუ ასეთი გაჩნდება, სწრაფად განიხილონ. ვუშვებთ Sora-ს მშობელთა კონტროლს ChatGPT‑ის მეშვეობით, რათა მშობლებს შეეძლოთ უსასრულო სქროლის ლიმიტების გადაფარვა, ალგორითმული პერსონალიზაციის გამორთვა და პირდაპირი შეტყობინებების პარამეტრების მართვა.
პერსონაჟებთან ერთად, თქვენ სრულად აკონტროლებთ თქვენს იერს Sora-ში თავიდან ბოლომდე. მხოლოდ თქვენ წყვეტთ, ვის შეუძლია თქვენი პერსონაჟის გამოყენება, და ნებისმიერ დროს შეგიძლიათ გააუქმოთ წვდომა ან წაშალოთ ნებისმიერი ვიდეო, რომელიც მას მოიცავს. თქვენზე შექმნილი პერსონაჟის შემცველი ვიდეოები, მათ შორის სხვა ადამიანების მიერ შექმნილი მონახაზებიც, თქვენთვის ნებისმიერ დროს ხილვადია.
ამ აპთან დაკავშირებით ბევრ უსაფრთხოების საკითხზე ვიმუშავეთ — თანხმობა იერის გამოყენებაზე, წარმომავლობა, საზიანო კონტენტის გენერაციის პრევენცია და სხვა მრავალი. მეტი დეტალისთვის იხილეთ ჩვენი Sora 2-ის უსაფრთხოების დოკუმენტი.
სხვა აპების ბევრი პრობლემა გამომდინარეობს მონეტიზაციის მოდელიდან, რომელიც წაახალისებს გადაწყვეტილებებს, რომლებიც მომხმარებლის კეთილდღეობას ეწინააღმდეგება. გულწრფელად რომ ვთქვათ, ამჟამად ჩვენი ერთადერთი გეგმაა, საბოლოოდ მომხმარებლებს მივცეთ შესაძლებლობა გადაიხადონ გარკვეული თანხა დამატებითი ვიდეოს გენერირებისთვის, თუ მოთხოვნა ხელმისაწვდომ გამოთვლით რესურსთან შედარებით ზედმეტად მაღალი იქნება. აპის განვითარებასთან ერთად, აქ ჩვენი მიდგომის ნებისმიერ ცვლილებას ღიად გაგიზიარებთ და მომხმარებლის კეთილდღეობას კვლავ მთავარ მიზნად დავიტოვებთ.
ჩვენ ამ გზის დასაწყისში ვართ, მაგრამ Sora 2-ით კონტენტის შექმნისა და გადაკეთების ყველა ამ ძლიერი შესაძლებლობის ფონზე, ამას სრულიად ახალი ეპოქის დასაწყისად ვხედავთ თანაშემოქმედებითი გამოცდილებებისთვის. ოპტიმისტურად ვართ განწყობილი, რომ ეს გასართობისა და კრეატიულობისთვის უფრო ჯანსაღი პლატფორმა იქნება, ვიდრე ის, რაც ახლა არსებობს. იმედია, კარგ დროს გაატარებთ :)
Sora iOS აპის(იხსნება ახალ ფანჯარაში) ჩამოტვირთვა უკვე შესაძლებელია. აპში შეგიძლიათ დარეგისტრირდეთ push-შეტყობინებისთვის, რათა გაიგოთ, როდის გაიხსნება წვდომა თქვენს ანგარიშზე. საწყის გავრცელებას დღეს აშშ-სა და კანადაში ვიწყებთ და ჩვენი მიზანია სწრაფად გავფართოვდეთ დამატებით ქვეყნებშიც. მოსაწვევის მიღების შემდეგ, Sora 2-ზე წვდომას ასევე შეძლებთ sora.com(იხსნება ახალ ფანჯარაში)-ის მეშვეობით. საწყის ეტაპზე Sora 2 უფასოდ იქნება ხელმისაწვდომი, დასაწყისისთვის საკმაოდ გულუხვი ლიმიტებით, რათა ადამიანებმა თავისუფლად შეისწავლონ მისი შესაძლებლობები, თუმცა ეს კვლავ გამოთვლითი რესურსის შეზღუდვებზე იქნება დამოკიდებული. ChatGPT Pro მომხმარებლებს ასევე შეეძლებათ გამოიყენონ ჩვენი ექსპერიმენტული, უფრო მაღალი ხარისხის Sora 2 Pro მოდელი sora.com(იხსნება ახალ ფანჯარაში)-ზე (და მალე Sora აპშიც). ასევე ვგეგმავთ Sora 2-ის API-ში გამოშვებას. Sora 1 Turbo ხელმისაწვდომი დარჩება და ყველაფერი, რაც შეგიქმნიათ, კვლავ თქვენს sora.com(იხსნება ახალ ფანჯარაში) ბიბლიოთეკაში დარჩება.
ვიდეომოდელები ძალიან სწრაფად, ძალიან მაღალ დონემდე ვითარდება. ზოგადი დანიშნულების სამყაროს სიმულატორები და რობოტული აგენტები საზოგადოებას საფუძვლიანად გარდაქმნის და ადამიანური პროგრესის ტრაექტორიას დააჩქარებს. Sora 2 ამ მიზნისკენ მნიშვნელოვან წინსვლას წარმოადგენს. OpenAI-ის მისიის ერთგულად, მნიშვნელოვანია, რომ ეს მოდელები განვითარების პროცესშივე მთელი კაცობრიობის სასარგებლოდ მუშაობდეს. ვფიქრობთ, Sora მსოფლიოს ბევრ სიხარულს, კრეატიულობასა და კავშირს მოუტანს.
— დაწერილია Sora გუნდის მიერ
მთავარი ობიექტი და ვიზუალი
პირველი აღქმა: დრაკონი დაკბილულ ყინულის სვეტებს შორის ელვისებურად მიფრინავს, ფრთის ბოლოები თოვლის მტვერს სპირალებად აყრის; მეორე აღქმა: მყინვარის დანაწევრებული საფარი კობალტისფერ ფიორდამდე ეშვება, ხოლო ქარვისფერი მზის კიდის შუქი ქერცლებზე მოყინულ ზედაპირს კოცნის; გამომეტყველება გადმოსცემს მტაცებლურ სიმშვიდეს / უშფოთველ ძალას.
ფორმატი და ვიზუალური იერი
5.0 წმ; 4K; 180° შატერი; დიდი ფორმატის ციფრული სენსორის ემულაცია მკაფიო მიკროკონტრასტით; ძალიან წვრილი გრაინი; თოვლის ანარეკლებზე თავშეკავებული ჰალაცია; კადრის რხევის გარეშე.
ობიექტივები და ფილტრაცია
მთავარი კადრი: 50მმ სფერული ობიექტივი ცხვირზე დამაგრებულ გირო-სტაბილიზებულ საჰაერო პლატფორმაზე (პარალელური ტრეკინგი მსუბუქი შიდა რკალით). ფილტრაცია: Black Pro-Mist 1/8; წრიული პოლარიზატორი სინათლეზე მორგებული, რომ მოთოკოს თოვლის სიკაშკაშე და შეინარჩუნოს ციმციმა ანარეკლები.
გრადაცია / პალიტრა
ნათელი ადგილები: სუფთა ყინულის თეთრი ცივი გადასვლით; შუა ტონები: ფოლადისფერი-ლურჯი მყინვარი და მკრთალი ცისფერი ჰაერი; ჩრდილები: ფიქალისფერი/მომწვანო-ლურჯი, შენარჩუნებული ნაპრალების დეტალებით; დრაკონის კიდეებზე თბილი ქარვისფერი კონტური გამოსაყოფად; მკვეთრი ანარეკლები ყინვასა და ქერცლებზე.
განათება და ატმოსფერო
გვიანი შუადღის დაბალი მზე ჯვარედინი ძირითადი განათებით; კატაბატური ქარი თოვლის მტვერს მაღლა სწევს; სიღრმისთვის თხელი გაყინული ბურუსი; ნაკვალევში ყინულის მტვრის პერიოდული ამოფრქვევები; დაძაბვისას დრაკონისგან სუსტად შესამჩნევი სუნთქვის ორთქლი.
ლოკაცია და კადრირება
მაღალი სერაკების ველი და დანის პირზე ჩამოსხმული ქედი; კამერა დრაკონის გვერდით, იმავე სიჩქარით, საშუალო სიმაღლეზე მიჰყვება, მყინვარის დიაგონალები კადრს ფიორდისკენ მიჰყავს; წინა პლანში ყინულის ფარფლები ახლოს ჩაუვლის პარალაქსისთვის; ადამიანური ნაგებობების გარეშე.
კოსტიუმი / რეკვიზიტი / ტრანსპორტის შენიშვნები
N/A (არსება). ზედაპირის აღქმა: მატოვანი რქის ქედები, ნახევრად ირიზებული ქერცლის ფირფიტები წინა კიდეებზე მიკრო-ყინვით.
ხმა
მაღალ სიმაღლეზე ქარის ჭრა, ფრთის მემბრანის გრუხუნი ყოველი მოქნევისას, სერაკებიდან ბროლისებრი ყინულის წკრიალი/ჭრიალი, შორეული მყინვარის მოწყვეტის გუგუნი; დრაკონის მოკლე ამოსუნთქვა/ღრენა: „Rrhh—“ (1 წმ-ზე ნაკლები). მუსიკის გარეშე — მხოლოდ დიეგეტიკური განცვიფრება.
ოპტიმიზებული კადრების სია (1 კადრი / 5.0 წმ)
0.0–5.0 — „პარალელური ქედის კვეთა“ (50მმ, ცხვირზე დამაგრებული საჰაერო კამერა მსუბუქი შიდა რკალით და მიკრო-წინწაწევით)
დრაკონს ვყვებით, როცა ის ყინულის სვეტების კორიდორში გზას იკაფავს; ფრთის ბოლოები თოვლის მტვერს ლენტებად შლის; ქვემოთ შორს მყინვარის მოწყვეტილი ფრაგმენტი ეცემა და ფხვნილის ღრუბელს აყენებს; კამერა ნელა უახლოვდება — ქერცლები იკითხება, ქარვისფერი კონტური ელვარებს — შემდეგ დრაკონი ფიორდისკენ იხრება, კუდი მაკრატელივით მოძრაობს და მყინვარზე მოძრავ ჩრდილს აჩენს.
მიზანი: ერთ გადამწყვეტ გატარებაში გადმოსცეს მითური მასშტაბი და ხელშესახები რეალიზმი — სიჩქარე, მასა და სტიქიური სიცივე.
კამერის შენიშვნები (რატომ მუშაობს)
50მმ აბალანსებს არსების მასშტაბურობას და პეიზაჟის სიდიადეს მისი დამცირების გარეშე; პარალელური ტრეკი + შიდა რკალი ყიდის სიჩქარესა და ფორმას; მიკრო-წინწაწევა ყველაზე ძლიერ მოქნევას ემთხვევა ძალის აქცენტისთვის; მსუბუქი პოლარიზატორი აკონტროლებს სიკაშკაშეს და ინარჩუნებს ციმციმს; უკანა/კიდის მზე სილუეტს ძერწავს; ახლოს ჩამვლელი ყინულის ფარფლები პარალაქსური სიჩქარის სიგნალებს იძლევა.
ფინიში
ძალიან წვრილი გრაინი (~15%); თოვლის ანარეკლებზე მინიმალური ჰალაცია; მსუბუქი ბეჭდვითი ემულაცია, რომ ლურჯები დამაჯერებელი დარჩეს და შავი ტონები მდიდარი იყოს; მრავალზოლიანი დინამიკა, რათა ფრთის გრუხუნმა არ დაფაროს მყინვარის მოწყვეტის გუგუნი; პოსტერის კადრი: მზით განათებულ სერაკზე გადახრილი დრაკონი, მიმავალი თოვლის მტვრით, ხოლო შორს ფიორდი ღრმა ლურჯად ანათებს.
Sora 2
Debbie Mesloh
Caroline Zhao
გამოქვეყნდა 30 სექტემბერს, 2025


