Негізгі мазмұнға өту
OpenAI

2025 ж. 30 қыркүйек

ЗерттеуШығарылымӨнім

Sora 2 осында

Бейне генерациялайтын ең жаңа моделіміз алдыңғы жүйелерге қарағанда физикалық тұрғыдан дәлірек, шынайырақ әрі басқаруға көбірек көнеді. Сондай-ақ онда синхрондалған диалог пен дыбыс әсерлері бар. Онымен жаңа Sora қолданбасында жасаңыз.

Жүктелуде…

2026 жылғы 26 сәуірден бастап Sora өнімі енді қолжетімді емес.


Бүгін біз Sora 2-ні, бейне мен аудио генерациялауға арналған флагмандық моделімізді ұсынамыз.

2024 жылғы ақпандағы түпнұсқа Sora моделі көп жағынан бейне үшін GPT‑1 сәті болды — бейне генерациясы шынымен жұмыс істей бастағандай көрінген алғашқы кез, әрі алдын ала үйретуге бөлінетін есептеу қуатын ұлғайту арқылы нысан тұрақтылығы сияқты қарапайым мінез-құлықтар пайда болды. Содан бері Sora командасы әлемді модельдеудің анағұрлым озық қабілеттері бар модельдерді үйретуге ден қойды. Мұндай жүйелер физикалық әлемді терең түсінетін AI модельдерін үйрету үшін аса маңызды болады деп сенеміз. Мұндағы басты меженің бірі — ауқымды бейне деректері бойынша алдын ала үйрету мен кейінгі үйретуді меңгеру; бұл тілмен салыстырғанда әлі бастапқы сатыда тұр.

Prompt: figure skater performs a triple axle with a cat on her head

Sora 2 арқылы біз бірден бейне үшін GPT‑3.5 сәті болуы мүмкін деп санайтын деңгейге секіріп отырмыз. Sora 2 алдыңғы бейне генерациясы модельдері үшін айрықша қиын — ал кей жағдайларда мүлде мүмкін емес — дүниелерді орындай алады: олимпиадалық гимнастика жаттығулары, қалқығыштық пен қаттылық динамикасын дәл модельдейтін сапбордтағы артқа сальто және мысық жан ұшыра жармасып тұрғандағы үштік аксельдер.

Prompt: a guy does a backflip

Алдыңғы бейне модельдері шамадан тыс оптимистік — мәтіндік көмексөзді орындап шығу үшін олар нысандарды түрлендіріп, шындықты бұрмалайды. Мысалы, баскетболшы допты салмаса, доп кенеттен себетке телепортацияланып кетуі мүмкін. Ал Sora 2-де баскетболшы мүлт кетсе, доп қалқаннан кері серпіледі. Бір қызығы, модель жіберетін «қателер» көбіне Sora 2 іштей бейнелейтін агенттің қателеріне ұқсайды; әлі мінсіз болмаса да, ол алдыңғы жүйелерге қарағанда физика заңдарына көбірек бағынады. Бұл кез келген пайдалы әлем симуляторы үшін өте маңызды қабілет — тек сәттілікті емес, сәтсіздікті де модельдей алуыңыз керек.

Бұл модель басқарылуы жағынан да үлкен серпіліс жасады: ол әлем күйін дәл сақтай отырып, бірнеше кадрға созылатын күрделі нұсқауларды орындай алады. Ол шынайы, кинематографиялық және аниме стильдерінде ерекше нәтиже көрсетеді.

Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...

Жалпы мақсаттағы бейне-аудио генерациялау жүйесі ретінде ол өте шынайы деңгейде күрделі фондық дыбыстық көріністерді, сөйлеуді және дыбыс әсерлерін жасай алады.

Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time

Сондай-ақ нақты әлем элементтерін Sora 2-ге тікелей енгізе аласыз. Мысалы, командамыздағы әріптестердің бірінің бейнесін бақылау арқылы модель оны кез келген Sora жасаған ортаға сырт келбеті мен дауысын дәл бере отырып қоса алады. Бұл мүмкіндік өте әмбебап және кез келген адамға, жануарға немесе нысанға жұмыс істейді.

Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much

Модель мінсізден әлі алыс және көп қате жібереді, бірақ бұл бейне деректерінде нейрондық желілерді әрі қарай ауқымдау бізді шындықты симуляциялауға жақындататынын растайды.

Sora 2-ні іске қосу

Жалпы мақсаттағы симуляцияға және физикалық әлемде әрекет ете алатын AI жүйелеріне апарар жолда біз жолай жасап жатқан модельдеріміз адамдарға көп қызық сыйлай алады деп ойлаймыз.

Біз бұл «өзіңді жүктеу» мүмкіндігімен бірнеше ай бұрын Sora командасында ойнай бастадық, және бәріміз одан қатты әсер алдық. Бұл бір жағынан қарым-қатынастың табиғи эволюциясы сияқты көрінді — мәтіндік хабарламалардан эмодзиге, одан дауыс жазбаларына, содан кейін осыған дейін.

Сондықтан бүгін біз Sora 2 негізінде жұмыс істейтін, жай ғана «Sora» деп аталатын жаңа әлеуметтік iOS қолданбасын іске қосып жатырмыз. Қолданбаның ішінде сіз жасай аласыз, бір-біріңіздің генерацияларыңызды ремикстей аласыз, баптауға болатын Sora таспасынан жаңа бейнелерді аша аласыз және «кейіпкерлер» деп аталатын мүмкіндік арқылы өзіңізді не достарыңызды кірістіре аласыз. Кейіпкерлермен сіз өзіңізді кез келген Sora сахнасына тікелей қоса аласыз: ол үшін қолданбада жеке басыңызды растау және келбетіңізді түсіру мақсатында бір реттік қысқа бейне мен аудио жазба жеткілікті.

Өткен аптада біз қолданбаны OpenAI ішіндегі барлық қызметкерге ішкі түрде іске қостық. Әріптестерімізден осы мүмкіндік арқылы компанияда жаңа достар тауып жатқанын да естідік. Біздіңше, осы «кейіпкерлер» мүмкіндігіне құрылған әлеуметтік қолданба — Sora 2 сиқырын сезінудің ең жақсы жолы.

Жауапкершілікпен іске қосу

Шексіз таспаны ойланбай қарай беру, тәуелділік, оқшаулану және RL-sloptimized таспаларға қатысты алаңдаушылықтар біз үшін басты назарда — міне, бұған байланысты не істеп жатырмыз.

Біз пайдаланушыларға таспа ішінде не көретінін өзі басқаруға арналған құралдар мен таңдау еркіндігін береміз. OpenAI-дың қолданыстағы ірі тілдік модельдерін пайдалана отырып, біз табиғи тіл арқылы нұсқау беруге болатын ұсыным алгоритмдерінің жаңа класын әзірледік. Сондай-ақ пайдаланушылардың хал-ахуалын мерзімді түрде сұрап, оларға таспасын түзету нұсқасын алдын ала ұсынатын кіріктірілген тетіктер жасадық.

Әдепкіде біз сізге негізінен өзіңіз жазылған немесе жиі әрекеттесетін адамдардың контентін көрсетеміз және модель сіздің өз туындыларыңызға шабыт ретінде пайдалануыңыз ықтимал деп санайтын бейнелерге басымдық береміз. Біз таспада өткізілген уақытты оңтайландырмаймыз және қолданбаны тұтынуды емес, жасауды барынша арттыру үшін әдейі жобаладық. Толығырақ мәліметті Таспа философиясынан таба аласыз.

Бұл қолданба достарыңызбен бірге қолдануға арналған. Тестілеушілерден келген басым пікір — оны өзгеше әрі қызықты ететін нәрсе кейіпкерлер екені; мұны шынымен түсіну үшін байқап көру керек, бірақ бұл адамдармен қарым-қатынас жасаудың жаңа әрі бірегей жолы. Сіз достарыңызбен бірге келуіңіз үшін біз мұны шақыру арқылы кіретін қолданба ретінде таратып жатырмыз. Ірі платформалардың бәрі әлеуметтік графтан алыстап бара жатқан шақта, кейіпкерлер қауымдастықты күшейтеді деп ойлаймыз.

Жасөспірімдердің әл-ауқатын қорғау біз үшін маңызды. Біз жасөспірімдердің таспада күніне көре алатын генерация санына әдепкі шектеулер енгізіп жатырмыз, сондай-ақ бұл топ үшін кейіпкерлерге қатысты қатаңырақ рұқсаттарды да қосып отырмыз. Автоматтандырылған қауіпсіздік жүйелерімізге қоса, буллинг туындаса, жағдайларды жылдам қарау үшін адам модераторларының командаларын кеңейтіп жатырмыз. Біз ChatGPT арқылы Sora ата-ана бақылауымен іске қосып жатырмыз, сондықтан ата-аналар шексіз айналдыру шектерін өзгерте алады, алгоритмдік дербестендіруді өшіре алады, сондай-ақ тікелей хабарлама баптауларын басқара алады.

Кейіпкерлермен бірге өз келбетіңізді басынан аяғына дейін өзіңіз басқарасыз. Кейіпкеріңізді кім пайдалана алатынын тек өзіңіз шешесіз, әрі оған қолжетімділікті кез келген уақытта қайтарып ала аласыз немесе ол бар кез келген бейнені өшіре аласыз. Сіздің кейіпкеріңіз бар бейнелерді, соның ішінде басқа адамдар жасаған нобайларды да, сіз кез келген уақытта көре аласыз.

Бұл қолданбада біз қарастырған қауіпсіздік тақырыптары өте көп — келбетті пайдалануға келісім, шығу тегі, зиянды контент генерациясының алдын алу және тағы басқалар. Толығырақ ақпаратты біздің Sora 2 қауіпсіздік құжатынан көре аласыз.

Басқа қолданбалардағы көптеген мәселе монетизация үлгісінің пайдаланушы әл-ауқатына қайшы келетін шешімдерді ынталандыруынан туындайды. Ашық айтсақ, әзірге жалғыз жоспарымыз — егер сұраныс қолжетімді есептеу қуатынан асып кетсе, пайдаланушыларға қосымша бір бейне генерациялау үшін белгілі бір ақы төлеу мүмкіндігін кейінірек ұсыну. Қолданба дамыған сайын, бұл тәсілдегі кез келген өзгерісті осы жерде ашық хабарлап отырамыз және басты мақсатымыз ретінде пайдаланушы әл-ауқатын сақтаймыз.

Біз бұл жолдың басында ғанамыз, бірақ Sora 2 көмегімен контентті жасау мен ремикстеудің барлық қуатты жолдарын ескере отырып, мұны бірлесіп шығармашылық тәжірибенің мүлде жаңа дәуірінің бастауы деп көреміз. Бұл қазіргі қолжетімді платформаларға қарағанда ойын-сауық пен шығармашылық үшін пайдалырақ алаң болады деп үміттенеміз. Сізге ұнайды деп сенеміз :)

Sora 2 қолжетімділігі және келесі қадамдар

Sora iOS қолданбасын(жаңа терезеде ашылады) қазір жүктеп алуға болады. Қолжетімділік сіздің аккаунтыңызға ашылған кезде push-хабарлама алу үшін қолданбаның ішінде тіркеле аласыз. Бастапқы таратуды бүгін АҚШ пен Канадада бастаймыз және оны жақын арада басқа елдерге де кеңейтуді көздейміз. Шақыру алғаннан кейін Sora 2-ге sora.com(жаңа терезеде ашылады) арқылы да кіре аласыз. Sora 2 бастапқыда тегін қолжетімді болады, адамдар оның мүмкіндіктерін еркін зерттей алуы үшін жомарт шектеулермен бастаймыз, бірақ олар бәрібір есептеу шектеулеріне тәуелді. ChatGPT Pro пайдаланушылары сондай-ақ sora.com(жаңа терезеде ашылады) сайтында (және жақында Sora қолданбасында да) біздің эксперименттік, сапасы жоғары Sora 2 Pro моделімізді пайдалана алады. Біз Sora 2-ні API-де де шығаруды жоспарлап отырмыз. Sora 1 Turbo қолжетімді болып қала береді, ал сіз жасағанның бәрі sora.com(жаңа терезеде ашылады) кітапханаңызда сақталады.

Бейне модельдері өте тез және өте жақсы дамып келеді. Жалпы мақсаттағы әлем симуляторлары мен робот агенттер қоғамды түбегейлі өзгертеді және адамзат ілгерілеуінің қарқынын жеделдетеді. Sora 2 осы мақсатқа қарай елеулі ілгерілеуді білдіреді. OpenAI миссиясына сай, бұл модельдер дамытылған сайын адамзаттың олардың игілігін көруі маңызды. Sora әлемге көп қуаныш, шығармашылық және байланыс әкеледі деп ойлаймыз.

— Sora командасы жазды

Негізгі нысана және визуалдар
Алғашқы әсер: қанат ұшындағы құйындар қар тозаңын іліп әкетіп, тісті мұз мұнараларының жанынан зулап өткен айдаһар; екінші әсер: мұздықтың жарылған жабыны кобальт түсті фьордқа құлап барады, ал янтарь күннің жиегі қабыршақтардағы қырауды сипап өтеді; кейпі жыртқыш сабырды / еш күш салмайтын қуатты білдіреді.

Пішім және көрініс
5,0 с; 4K; 180° ысырма; айқын микро-контраст беретін үлкен форматты цифрлық сенсор эмуляциясы; өте ұсақ түйіршік; қар жылтылында бәсең гало; gate weave жоқ.

Объективтер және сүзгілер
Негізгі кадр: мұрынға бекітілген гиротұрақтандырылған әуе платформасындағы 50 мм сфералық объектив (ішке аздап доғалана параллель қадағалау). Сүзгілеу: Black Pro-Mist 1/8; қар шағылысын басып, нүктелік жарқылды сақтау үшін аз жарыққа қойылған дөңгелек поляризатор.

Грейд / палитра
Жарық аймақтар: салқын жұмсаруымен таза мұздай ақ; орта реңктер: болат-көк мұздық пен боз көгілдір ауа; көлеңкелер: жарықшақ деталі сақталған тақтатас/көгілдір-жасыл; айдаһар жиегінде бөлектеу үшін жылы янтарь жиек; қырау/қабыршақта жинақы жарқыл.

Жарық және атмосфера
Кешкі төмен күннің қиғаш негізгі жарығы; қар тозаңын көтерген катабатикалық жел; тереңдік үшін жұқа мұзды тұман; ізінде мезгіл-мезгіл мұз шаңының атқылауы; күш түскенде айдаһардан әлсіз бу тәрізді тыныс.

Локация және кадрлау
Асқақ серек алқабы мен пышақ жүзіндей қыр жотасы; камера орта биіктікте айдаһармен қатар жылдамдықта ілесіп, мұздық диагональдары фьордқа қарай жетелейді; алдыңғы жақтағы мұз қанатшалары параллакс беру үшін жақыннан өтеді; адам қолымен жасалған құрылымдар жоқ.

Киім / реквизит / көлік ескертпелері
Жоқ (мақұлық). Беткі сипаты: күңгірт мүйіз қырлары, алдыңғы жиегінде микро-қырауы бар жартылай құбылмалы қабыршақ тақташалары.

Дыбыс
Биіктегі жел ығысуы, әр төмен қағыста қанат жарғағының күркірі, серектерден шығатын кристалды мұз тықылы/сықыры, алыстағы мұздықтың опырылу гүрілі; айдаһардан қысқа дем шығару/күңірену: «Ррһһ—» (1 с-тан аз). Әуен жоқ — тек кадр ішіндегі ғажап сезімі.

Оңтайландырылған кадр тізімі (1 кадр / 5,0 с)
0,0–5,0 — «Параллель жота бойымен тіліп өту» (50 мм, аздап ішке доғалана микрожақындауы бар мұрынға бекітілген әуе түсірілімі)
Біз айдаһармен қатарласа, оның мұз мұнаралары дәлізімен зулап өткенін ілесіп түсіреміз; қанат ұшындағы құйындар қар тозаңын таспаға айналдырады; алыста төменде мұздың опырылған бөлігі құлап, ұнтақ бұлтын көтереді; камера баяу жақындайды — қабыршақтар көрінеді, янтарь жиек лап етеді — содан кейін айдаһар фьордқа қарай бұрылып, құйрығын қайшылап, мұздық үстіне сырғыған көлеңке түсіреді.
Мақсат: бір шешуші өтуде мифтік ауқым мен сезілетін шынайылықты беру — жылдамдық, масса және табиғаттың мұздай суығы.

Камера ескертпелері (неге әсерлі көрінеді)
50 мм мақұлықтың айбындылығы мен пейзаж ауқымын кішірейтпей тең ұстайды; параллель трек + ішке доға жылдамдық пен пішінді сездіреді; микрожақындау ең күшті төмен қағысқа дәл келіп, қуатты айқындайды; жеңіл поляризатор жарқылды сақтай отырып, шағылысты басады; артқы/жиек күн силуэтті мүсіндейді; жанай өткен мұз қанатшалары параллакс арқылы жылдамдықты аңғартады.

Финиш
Өте ұсақ түйіршік (~15%); қардағы нүктелік жарқылда гало өте аз; көктердің нанымдылығын және қаралардың қанықтығын сақтау үшін жұмсақ print emulation; мұздық опырылуының гүрілін бүркемелемей, қанат дүрсілін сақтау үшін көпжолақты динамика; постер кадры: күн түскен серек үстінен қиғаш бұрылған айдаһар, артына шұбалған қар тозаңы, ар жағында терең көк фьорд жарқырайды.

Sora 2

ЗерттеуHarold Li, Dmytro Okhonko, Avi Verma, Eric Zhang, Ricky Wang, Troy Luhman, Eric Luhman, Bram Wallace, Eric Mintun, Michael Chang, Gabriel Petersson, Jure Zbontar, Daniel Geng, Will DePue, Alex Zhao, Cheng Lu, Yufei Guo, Pritam Damania, Larry Kai, Farzad Khorasani, Kenji Hata, James Betker, Vladimir Chalyshev, Connor Holmes, Aditya Ramesh, Bill Peebles
ӨнімAndrew Kondrich, Andrew Sima, Andrew Thieck, Andrey Malevich, Antonio Di Francesco, Bin Wen, Bing Liang, Boyang Niu, Cheng Su, Cristina Scheau, Daniel Latta-Lin, David Schnurr, Dhruba Borthakur, Duc Tran, Gilman Tolle, Greg Hochmuth, Joe Taylor, Joey Flynn, Joey Pereira, Julius Hochmuth, Key Shin, Liam Esparraguera, Liang Wu, Liang Xiong, Mengchao Zhong, Michelle Hwang, Mick Jermsurawong, Mike Starr, Omar Elfanek, Patrick Hum, Pavel Komlev, Rajeev Nayak, Raunak Daga, Rohan Sahai, Sergii Rudenko, Shuyi Chen, Tarek Younes, Thomas Bredillet, Thomas Dimson, Victoria Huang, Vladimir Chalyshev, Welton Wang, Wesam Manassra, Xiaolong Wang, Yizhe Yu, Yun Jiang, Zhigang Wang
Үлес қосушыларAarash Heydari, Chad Nelson, Daniel Fradin, David Duxin, Hessam Bagherinezhad, Jasmyn Samaroo, Jay Wang, Jess Manzano, Kendra Rimbach, Nikki Sommer, Sergei Vorobev, Shirong Wu, Soham Govande, Souki Mansoor, Tifa Chen, Tomer Kaftan, Tyce Walters, Varun Shetty
Көшбасшылық
Bill Peebles
Sora
Connor Holmes
Systems
Rohan Sahai
Product
Thomas Dimson
Product
Natalie Summers
Chief of Staff
Aditya Ramesh
Organization
Арнайы алғысAdam Majmudar, Adele Li, Alexey Ivanov, Aravind Suresh, Arun Vijayvergiya, Ashkay Pall, Ben Leimberger, Brad Lightcap, Charlotte Cole, Chris Hallacy, Chris Koch, Christine McLeavey, Christopher Lehane, Dane Stuckey, Ed Bayes, Eric Sigler, Eric Wallace, Fidji Simo, Gabriel Goh, Gary Briggs, Geoff Salmon, Giancarlo Lionetti, Greg Brockman, Hannah Wong, Ian Sohl, Jakub Pachocki, Jamie Kiros, Jason Kwon, Jeffrey Han, Joanne Jang, Johannes Heidecke, Josh Achiam, Kate Rouch, Kevin Weil, Lauren Itow, Li Jing, Mark Chen, Mark Gewurz, Matt Knight, Matthew Isono, Max Burkhardt, Mayank Gupta, Mia Glaese, Michelle Fradin, Nick Turley, Patrick Geonetta, Peter Welinder, Philip Bogdanov, Prafulla Dhariwal, Robert Xiong, Ryan O'Rourke, Sam Altman, Sarah Friar, Sarah Russell, Sarah Warkov, Spencer Kim, Spencer Papay, Srinivas Narayanan, Sulman Choudhry, Szymon Sidor, Tejal Patwardhan, Vikki Lampton, Vlad Fomenko, Wojciech Zaremba, Yihong Song, Young Cha, Yuchen Zhang
Қауіпсіздік, тұтастық, өнім саясаты, i2, пайдаланушы әрекеттеріAdam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, Claudia Fischer, Garrett Harkins, Gilman Tolle, Jackie Hehir, Jake Brill, Jesika Haria, Kate Birks, Kelly Stirman, Lauren Jonas, Mentong Zhang, Pedram Keyani, Pedro Aguilar, Ryan Rinaldi, Sam Toizer, Sarah Ryan, Savannah Heon, Shalli Jain, Shauna O'Brien, Tim Boll, Zoe Stoll
ҚұқықтықTyce Walters, Ali Buttars, Brian McKnight, Gideon Myles, Tom Rubin, Dani Westbrook, Charles Proctor
БайланысAlex Baker-Whitcomb, Anna McKean, Ashley Tyra, Bailey Richardson, Gaby Raila, Julie Steele, Leah Anise, Niko Felix
Маркетинг, дизайн және шығармашылықAdam Brandon, Adrian Gunadi, Alexandr Khomyakov, Anne Oburgh, Antonia Richmond, Ben King, Cary Hudson, Chloe Bowers, Chris Hutchinson, Ciaran Rogers, Dalhae Lee, Dana Palmie, Daniel Stuhlpfarrer, Daniel Zhang, Elisha Greenwell Dargan, Ian Silber, Indgila Sama Ali, Jeffrey Sabin-Matsumoto, Josh Cleveland, Kaitlin Giannetti, Kenneth Kuh, Kim Baschet, Malisa Kuch, Melia Tandiono, Michaela McCrink, Minnia Feng, Nick Ciffone, Paymon Parsia, Phillip Kim, Phillip Kim, Raegan Allsbrook, Roy Chen, Shannon Jager, Thomas Degry, Xingle Huang, Yara Khakbaz, Zach Stubenvoll
Жаһандық мәселелерClaudia Fischer
Debbie Mesloh
Стратегиялық қаржыChengpeng Mou
Caroline Zhao
APIAdam Wells, Alina Wu, Amelia Liu, Andi Liu, Ankit Gohel, Annie Cheng, Artyi Xu, Brian Ratajczak, Chad Nelson, Erika Kettleson, Filippo Raso, Gilman Tolle, Jackie Hehir, Jeff Harris, Jen Robinson, Joanne Shin, Jon Okun, Katia Gil Guzman, Kelly Stirman, Leher Pathak, Manoli Liodakis, Miqdad Jaffer, Olivia Morgan, Robin Koenig, Rohan Sahai, Ruth Costigan, Sarah Ryan, Savannah Heon, Shaokyi Amdo, Shaili Jain, Tabarak Khan, Tonia Osadebe, Tyce Walters, Wei Sun, Wendy Jiao, Woo Kim, Yi Ma
Калифорния штаты, Сан-Франциско қаласында OpenAI әзірлеген
Жарияланған күні: 30 қыркүйек, MMXXV

Автор

The Sora team