Pāriet uz galveno saturu
OpenAI

2025. gada 30. septembris

IzpēteIzlaidumsProdukts

Sora 2 ir klāt

Mūsu jaunākais video ģenerēšanas modelis ir fiziski precīzāks, reālistiskāks un vieglāk kontrolējams nekā iepriekšējās sistēmas. Tajā ir ietverti arī sinhronizēti dialogi un skaņas efekti. Radi jaunajā Sora lietotnē.

Notiek ielāde…

No 2026. gada 26. aprīļa Sora produkts vairs nav pieejams.


Šodien mēs izlaižam Sora 2, mūsu vadošo video un audio ierakstu ģenerēšanas modeli.

Sākotnējais Sora modelis 2024. gada februārī daudzējādā ziņā bija GPT‑1 brīdis video—pirmo reizi video ģenerēšana šķietami sāka darboties, un, palielinot iepriekšējas apmācības aprēķinu apjomu, parādījās tādas vienkāršas normas kā objektu pastāvība. Kopš tā laika Sora komanda ir koncentrējusies uz mācību modeļiem ar modernākām pasaules simulācijas iespējām. Mēs uzskatām, ka šādas sistēmas būs ļoti svarīgas, lai apmācītu mākslīgā intelekta modeļus, kas padziļināti izprot fizisko pasauli. Būtisks pagrieziena punkts šajā jomā ir priekšapmācības un pēcapmācības veikšana attiecībā uz liela apjoma video datiem, kas salīdzinājumā ar valodu ir tikai sākuma stadijā.

Prompt: figure skater performs a triple axle with a cat on her head

Ar Sora 2, mēs tieši pārejam uz to, kas, mūsuprāt, varētu būt GPT‑3.5 brīdis video. Sora 2 var paveikt lietas, kas ir ārkārtīgi sarežģītas—un dažos gadījumos pilnīgi neiespējamas—iepriekšējo video paaudžu modeļiem: olimpiskās vingrošanas rutīnas, atpakaļsalto uz airu dēļa, kas precīzi modelē peldspējas un noturības dinamiku, un trīskāršus kaķa akselus kopā ar slidotāju.

Prompt: a guy does a backflip

Iepriekšējie video modeļi ir pārāk optimistiski — tie pārveido objektus un deformē realitāti, lai veiksmīgi izpildītu teksta uzvedni. Piemēram, ja basketbolists netrāpa metienu, bumba var spontāni teleportēties uz grozu. Sora 2, ja basketbolists netrāpa metienu, bumba atsitīsies pret vairogu. Interesanti, ka modeļa “kļūdas” bieži šķiet iekšējā aģenta kļūdas, ko Sora 2 netieši modelē. Lai gan joprojām nepilnīgs, šis modelis labāk ievēro fizikas likumus, salīdzinot ar iepriekšējām sistēmām. Šī ir ārkārtīgi svarīga spēja jebkuram lietderīgam pasaules simulatoram—tam ir jāspēj modelēt ne tikai panākumus, bet arī neveiksmes.

Modelis ir arī liels solis uz priekšu kontrolējamības ziņā, spējot izpildīt sarežģītus norādījumus, kas aptver vairākus kadrus, vienlaikus precīzi saglabājot pasaules stāvokli. Tam ir izcilas spējas reālistisku, kinematogrāfisku un anime stilu jomā.

Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...

Kā vispārējas nozīmes video-audio ģenerēšanas sistēma, tā spēj izveidot sarežģītas fona skaņu ainavas, sarunas un skaņas efektus ar augstu reālisma pakāpi.

Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time

Tu vari arī tieši ievietot reālās pasaules elementus Sora 2. Piemēram, noskatoties kāda mūsu komandas biedra video, modelis var viņu ievietot jebkurā Sora ģenerētā vidē ar precīzu izskata un balss attēlojumu. Šī spēja ir ļoti vispārīga un darbojas ar jebkuru cilvēku, dzīvnieku vai objektu.

Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much

Modelis ir tālu no ideāla un pieļauj daudz kļūdu, taču tas apliecina, ka turpmāka neironu tīklu paplašināšana video datos mūs tuvina realitātes simulācijai.

Sora 2 izvietošana

Mēs uzskatām, ka ceļā uz vispārējas nozīmes simulācijas un mākslīgā intelekta sistēmām, kas var darboties fiziskajā pasaulē, cilvēki var gūt daudz prieka, izmantojot mūsu pašreizējos modeļus.

Mēs pirmo reizi sākām spēlēties ar šo funkciju "augšupielādē sevi" pirms vairākiem mēnešiem Sora komandas ietvaros, un mēs visi bijām sajūsmā. Tā šķita kā dabiska komunikācijas evolūcija - sākot no īsziņām, emocijzīmēm un balss ziņām līdz šai iespējai.

Šodien mēs laižam klajā jaunu sociālo iOS lietotni ar nosaukumu “Sora”, ko nodrošina Sora 2. Šajā lietotnē jūs varat izveidot videoklipus, pārveidot viens otra ģenerētos darbus, atklāt jaunus videoklipus pielāgojamā Sora plūsmā un pievienot sevi vai savus draugus, izmantojot funkciju ar nosaukumu “tēli”. Ar tēliem tu vari nekavējoties iejusties jebkurā Sora ainā ar ievērojamu precizitāti pēc īsa vienreizēja video un audio ieraksta uzņemšanas lietotnē, lai verificētu savu identitāti un iemūžinātu savu līdzību.

Pagājušajā nedēļā visi OpenAI darbinieki uzsāka lietotnes iekšēju izmantošanu. Mēs jau esam dzirdējuši, ka mūsu kolēģi uzņēmumā iegūst jaunus draugus, pateicoties šim līdzeklim. Mēs uzskatām, ka sociālā lietotne, kas veidota ap šo “tēlu” funkciju, ir labākais veids, kā izbaudīt Sora 2 burvību.

Atbildīga palaišana

Bažas par doomscrollingu, atkarību, izolāciju un RL-sloptimizētām plūsmām ir būtiskas—lūk, ko mēs darām, lai šīs problēmas risinātu.

Mēs sniedzam lietotājiem rīkus un izvēles iespējas, lai viņi varētu kontrolēt saturu savā plūsmā. Izmantojot OpenAI esošos lielos valodu modeļus, mēs esam izstrādājuši jaunu ieteikšanas algoritmu klasi, kurus var vadīt ar dabisko valodu. Mums ir arī iebūvēti mehānismi, kas ļauj periodiski aptaujāt lietotājus par viņu labklājību un proaktīvi dot iespēju pielāgot plūsmu.

Pēc noklusējuma mēs rādām saturu, kas ir tieši saistīts ar cilvēkiem, kuriem tu seko vai ar kuriem mijiedarbojies, un piedāvājam videoklipus, kurus, pēc modeļa domām, tu varētu izmantot kā iedvesmu saviem radošajiem darbiem. Mēs necenšamies mākslīgi palielināt laiku, kas pavadīts plūsmā – mēs izveidojām šo lietotni, lai maksimāli veicinātu radošumu, nevis patēriņu. Vairāk informācijas vari atrast mūsu Plūsmas filozofijā

Šī lietotne ir paredzēta izmantošanai kopā ar taviem draugiem. Mēs saņemam pārliecinošas atsauksmes no testētājiem, ka tēli ir tie, kas padara šo lietotni atšķirīgu un aizraujošu. Tev tā ir jāizmēģina, lai to patiešām saprastu, jo tas ir jauns un unikāls veids, kā sazināties ar cilvēkiem. Mēs to izlaižam kā lietotni, kas balstīta uz ielūgumiem, lai nodrošinātu, ka tu sāc to lietot kopā ar saviem draugiem. Šobrīd, kad visas lielās platformas attālinās no sociālā aspekta, mēs uzskatām, ka tēli stiprinās kopienas saikni.

Mums ir svarīga pusaudžu labklājības aizsardzība . Mēs ieviešam noklusējuma ierobežojumus tam, cik daudz ģenerētā satura pusaudži var redzēt plūsmā dienā, un šai grupai arī ieviešam stingrākas atļaujas attiecībā uz tēliem. Papildus mūsu automatizētajām drošības sistēmām mēs paplašinām cilvēku moderatoru komandas, lai ātri pārskatītu bulinga gadījumus, ja tādi rodas. Mēs palaižam Sora vecāku kontroli ChatGPT platformā, lai vecāki varētu atcelt bezgalīgas ritināšanas ierobežojumus, izslēgt algoritma personalizāciju, kā arī pārvaldīt tiešo ziņojumu iestatījumus.

Ar tēliem tu kontrolē savu līdzību no sākuma līdz beigām Sora platformā Tikai tu izlem, kas var izmantot tavu tēlu, un tu jebkurā laikā vari atcelt piekļuvi vai izņemt jebkuru videoklipu, kurā tas ir iekļauts. Tu vari jebkurā laikā apskatīt videoklipus, kuros ir redzams tavs tēls, tostarp citu personu izveidotos projektus.

Šajā lietotnē esam pievērsušies daudziem drošības aspektiem, tādiem kā piekrišana līdzības izmantošanai, izcelsme, kaitīga satura radīšanas novēršana un daudziem citiem jautājumiem. Plašāku informāciju lasi mūsu Sora 2 drošības dokumentā.

Daudzas problēmas ar citām lietotnēm rodas monetizācijas modeļa dēļ, kas mudina pieņemt lēmumus, kas ir pretrunā ar lietotāju labklājību. Mūsu vienīgais pašreizējais plāns acīmredzami ir ar laiku piedāvāt lietotājiem iespēju maksāt noteiktu summu, lai ģenerētu papildu videoklipus, gadījumā, ja radīsies pārāk liels pieprasījums salīdzinājumā ar pieejamo skaitļošanas jaudu. Lietotnei attīstoties, mēs šeit atklāti paziņosim par jebkādām izmaiņām, vienlaikus saglabājot lietotāju labklājību kā galveno mērķi.

Mēs pagaidām esam tikai šī ceļojuma sākumā, taču, ņemot vērā visas milzīgās iespējas radīt un remiksēt saturu ar Sora 2, mēs uzskatām, ka šis ir pilnīgi jaunas ēras sākums koprades pieredzes veidošanā. Mēs ticam, ka šī būs veselīgāka platforma izklaidei un radošai izpausmei, salīdzinot ar to modeli, kas ir pieejams pašlaik. Mēs ceram, ka tu lieliski pavadīsi laiku :)

Sora 2 pieejamība un nākamie soļi

Sora iOS lietotne(atveras jaunā logā) tagad ir pieejama lejupielādei. Tu vari reģistrēties lietotnē, lai saņemtu pašpiegādes paziņojumu, kad tiks atvērta piekļuve tavam kontam. Mēs sākam ar ASV un Kanādu un plānojam drīzumā paplašināt piekļuvi arī citās valstīs. Pēc ielūguma saņemšanas tu varēsi piekļūt Sora 2 arī vietnē sora.com(atveras jaunā logā). Sākotnēji Sora 2 būs bez maksas ar elastīgiem ierobežojumiem, lai lietotāji varētu brīvi izpētīt visas iespējas, taču skaitļošanas jaudas ierobežojumi joprojām ir spēkā. ChatGPT Pro lietotāji varēs izmantot arī mūsu eksperimentālo, augstākas kvalitātes Sora 2 Pro modeli vietnē sora.com(atveras jaunā logā) (un drīz arī Sora lietotnē). Mēs plānojam izlaist Sora 2 arī API platformā. Sora 1 Turbo turpina darboties, un viss, kas līdz šim ir izveidots, būs pieejams tavā sora.com(atveras jaunā logā) bibliotēkā.

Video modeļi ļoti ātri attīstās un progresē. Vispārējas nozīmes pasaules simulatori un robotizēti aģenti būtiski ietekmēs sabiedrību un paātrinās cilvēces progresa gaitu. Sora 2 ir nozīmīgs solis šī mērķa sasniegšanā. Saskaņā ar OpenAI misiju ir svarīgi panākt, ka cilvēce gūst labumu no šiem modeļiem to izstrādes laikā. Mēs uzskatām, ka Sora sagādās daudz prieka, radošuma un nodošinās saikni ar pasauli.

— sagatavoja Sora Team

Primārais mērķis un vizuālais tēls
Pirmais iespaids: pūķis brāžas pāri robainām ledus smailēm, spārnu vēdas sagriež sniegu vērpetēs; otrais iespaids: ledāja plaisas atsedz kobalta zilu fjordu un dzintara krāsas saules stari glāsta apsarmojušas zvīņas uz pūķa ķermeņa; izteiksmes iespaids parāda plēsēja mieru/klusu spēku.

Formāts un izskats
5.0 s; 4 K; 180 ° aizvars; lielformāta digitālā sensora emulācija ar izteiktu mikrokontrastu; sīkgraudains attēls; ierobežota halācija uz sniega atspīdumiem; bez lentes pārejas.

Objektīvi un filtrēšana
Hero: 50 mm sfēriskais objektīvs uz priekšpusē uzstādītas žiroskopiski stabilizētas antenas platformas (paralēla izsekošana ar nelielu iekšēju loku). Filtrēšana: Black Pro-Mist 1/8; apļveida polarizators iestata gaismu, lai mazinātu sniega atspīdumu, vienlaikus saglabājot mirdzošu dzirksti.

Pakāpe/palete
Izcēlumi: tīrs ledus baltums ar vēsu vertikāli; vidustoņi: tērauda zils ledājs un gaišas ciāna krāsas debesis; ēnas: šīfera/zilganzaļa krāsa ar dziļām ledāju plaisām; silta dzintara krāsas pūķa kontūru mala tēla nošķiršanai; spoguļstari virzīti uz apledojumu/zvīņām.

Apgaismojums un atmosfēra
Vēla pēcpusdiena, zemu saules staru atspīdums; katabātisks vējš saceļ sniega vērpetes; smalka, sasalusi migla dziļuma efektam; tam sekojoši periodiski ledus putekļu uzplaiksnījumi; maigi piepūles radīti pūķa izelpas izgarojumi

Atrašanās vieta un kadrēšana
Augstu ledus grēdu virsotņu lauks un naža asmenim līdzīgas kores; kamera seko pūķim vienādā ātrumā vidējā augstumā, ledāja diagonāles ved fjorda virzienā; priekšplāna ledus vērpetes šaujas tuvu garām paralakses efektam; nav cilvēku veidotu būvju.

Garderobe / rekvizīti / transportlīdzekļu piezīmes
N/A (radība). Virsmas iespaids: matētas kalnu virsotnes, viegli zaigojošas zvīņas ar nelielu priekšējās daļas apsarmojumu.

Skaņa
Augstu gaisa masu vēja brāzmas, spārnu membrānas švīkoņa katrā spārnu nolaišanas brīdī, kristāliska ledus plīšanas/sērsnas garozas lūšanas skaņa, attāla ledāju brukšanas duna; strauja pūķa izelpa/rūciens: "Rrhh-" (sub-1s). Nav vērtējuma — patiesa dieģētiska bijība.

Optimizēts kadru saraksts (1 kadrs / 5,0 s)
0,0–5,0 — “Parallel Ridge Carve” (50 mm, priekšpusē stiprināta antenas platforma ar nelielu iekšējo loku un mikrospiedienu)
Mēs sekojam pūķim, kas brāžas pāri ledus smailēm aiz sevis atstājot samalta sniega virpuļu astes; tālu aizā iekrīt ledus atlūza, radot putekļu mākoni; kamera pietuvojas tuvāk—zvīņu izskats, dzintara krāsas kontūru apveids—tad pūķis pagriežas fjorda virzienā, aste aizšķērso skatu metot plašu ēnu pār ledāju.
Mērķis: nodrošināt mītisku mērogu un taustāmu reālismu vienā izšķirošā piegājienā - ātrums, masa un stihisks aukstums.

Kameras piezīmes (ko tā nolasa)
50 mm līdzsvaro radības klātbūtni un ainavas mērogu, neminiaturizējot; paralēlais celiņš + iekšējais loks nodrošina ātrumu un formu; mikrospiešanas laiki ar spēcīgiem lejupvērstiem vēzieniem jaudas akcentam; gaismas polarizators kontrolē atspīdumu, vienlaikus saglabājot mirdzumu; aizmugurē esošais saules loks veido siluetu; tuvu lidojošās ledus vērpetes rada paralakses ātruma sajūtu.

Apdare
Ļoti smalka graudainība (~15%); minimāla sniega atspīduma halācija; viegla emulācija, lai saglabātu zilo toņu reālismu un piesātinātus melnos toņus; daudzjoslu dinamika, lai saglabātu spārnu švīkoņu, neslāpējot to nolaišanās dunu; kadra ietvars: pūķis slīd pāri saules apspīdētai sērsnai, vējš sagriežas vērpetēs, tālē kvēlojoši zils fjords.

Sora 2

IzpēteHarold Li, Dmytro Okhonko, Avi Verma, Eric Zhang, Ricky Wang, Troy Luhman, Eric Luhman, Bram Wallace, Eric Mintun, Michael Chang, Gabriel Petersson, Jure Zbontar, Daniel Geng, Will DePue, Alex Zhao, Cheng Lu, Yufei Guo, Pritam Damania, Larry Kai, Farzad Khorasani, Kenji Hata, James Betker, Vladimir Chalyshev, Connor Holmes, Aditya Ramesh, Bill Peebles
ProduktsAndrew Kondrich, Andrew Sima, Andrew Thieck, Andrey Malevich, Antonio Di Francesco, Bin Wen, Bing Liang, Boyang Niu, Cheng Su, Cristina Scheau, Daniel Latta-Lin, David Schnurr, Dhruba Borthakur, Duc Tran, Gilman Tolle, Greg Hochmuth, Joe Taylor, Joey Flynn, Joey Pereira, Julius Hochmuth, Key Shin, Liam Esparraguera, Liang Wu, Liang Xiong, Mengchao Zhong, Michelle Hwang, Mick Jermsurawong, Mike Starr, Omar Elfanek, Patrick Hum, Pavel Komlev, Rajeev Nayak, Raunak Daga, Rohan Sahai, Sergii Rudenko, Shuyi Chen, Tarek Younes, Thomas Bredillet, Thomas Dimson, Victoria Huang, Vladimir Chalyshev, Welton Wang, Wesam Manassra, Xiaolong Wang, Yizhe Yu, Yun Jiang, Zhigang Wang
LīdzstrādniekiAarash Heydari, Chad Nelson, Daniel Fradin, David Duxin, Hessam Bagherinezhad, Jasmyn Samaroo, Jay Wang, Jess Manzano, Kendra Rimbach, Nikki Sommer, Sergei Vorobev, Shirong Wu, Soham Govande, Souki Mansoor, Tifa Chen, Tomer Kaftan, Tyce Walters, Varun Shetty
Vadība
Bill Peebles
Sora
Connor Holmes
Systems
Rohan Sahai
Product
Thomas Dimson
Product
Natalie Summers
Chief of Staff
Aditya Ramesh
Organization
Īpaša pateicībaAdam Majmudar, Adele Li, Alexey Ivanov, Aravind Suresh, Arun Vijayvergiya, Ashkay Pall, Ben Leimberger, Brad Lightcap, Charlotte Cole, Chris Hallacy, Chris Koch, Christine McLeavey, Christopher Lehane, Dane Stuckey, Ed Bayes, Eric Sigler, Eric Wallace, Fidji Simo, Gabriel Goh, Gary Briggs, Geoff Salmon, Giancarlo Lionetti, Greg Brockman, Hannah Wong, Ian Sohl, Jakub Pachocki, Jamie Kiros, Jason Kwon, Jeffrey Han, Joanne Jang, Johannes Heidecke, Josh Achiam, Kate Rouch, Kevin Weil, Lauren Itow, Li Jing, Mark Chen, Mark Gewurz, Matt Knight, Matthew Isono, Max Burkhardt, Mayank Gupta, Mia Glaese, Michelle Fradin, Nick Turley, Patrick Geonetta, Peter Welinder, Philip Bogdanov, Prafulla Dhariwal, Robert Xiong, Ryan O'Rourke, Sam Altman, Sarah Friar, Sarah Russell, Sarah Warkov, Spencer Kim, Spencer Papay, Srinivas Narayanan, Sulman Choudhry, Szymon Sidor, Tejal Patwardhan, Vikki Lampton, Vlad Fomenko, Wojciech Zaremba, Yihong Song, Young Cha, Yuchen Zhang
drošība, integritāte, produktu politika, i2, lietotāju operatīvās darbībasAdam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, Claudia Fischer, Garrett Harkins, Gilman Tolle, Jackie Hehir, Jake Brill, Jesika Haria, Kate Birks, Kelly Stirman, Lauren Jonas, Mentong Zhang, Pedram Keyani, Pedro Aguilar, Ryan Rinaldi, Sam Toizer, Sarah Ryan, Savannah Heon, Shalli Jain, Shauna O'Brien, Tim Boll, Zoe Stoll
JuridisksTyce Walters, Ali Buttars, Brian McKnight, Gideon Myles, Tom Rubin, Dani Westbrook, Charles Proctor
KomunikācijaAlex Baker-Whitcomb, Anna McKean, Ashley Tyra, Bailey Richardson, Gaby Raila, Julie Steele, Leah Anise, Niko Felix
Mārketings, dizains un radošā darbībaAdam Brandon, Adrian Gunadi, Alexandr Khomyakov, Anne Oburgh, Antonia Richmond, Ben King, Cary Hudson, Chloe Bowers, Chris Hutchinson, Ciaran Rogers, Dalhae Lee, Dana Palmie, Daniel Stuhlpfarrer, Daniel Zhang, Elisha Greenwell Dargan, Ian Silber, Indgila Sama Ali, Jeffrey Sabin-Matsumoto, Josh Cleveland, Kaitlin Giannetti, Kenneth Kuh, Kim Baschet, Malisa Kuch, Melia Tandiono, Michaela McCrink, Minnia Feng, Nick Ciffone, Paymon Parsia, Phillip Kim, Phillip Kim, Raegan Allsbrook, Roy Chen, Shannon Jager, Thomas Degry, Xingle Huang, Yara Khakbaz, Zach Stubenvoll
Globālā situācijaClaudia Fischer
Debbie Mesloh
Stratēģiskās finansesChengpeng Mou
Caroline Zhao
APIAdam Wells, Alina Wu, Amelia Liu, Andi Liu, Ankit Gohel, Annie Cheng, Artyi Xu, Brian Ratajczak, Chad Nelson, Erika Kettleson, Filippo Raso, Gilman Tolle, Jackie Hehir, Jeff Harris, Jen Robinson, Joanne Shin, Jon Okun, Katia Gil Guzman, Kelly Stirman, Leher Pathak, Manoli Liodakis, Miqdad Jaffer, Olivia Morgan, Robin Koenig, Rohan Sahai, Ruth Costigan, Sarah Ryan, Savannah Heon, Shaokyi Amdo, Shaili Jain, Tabarak Khan, Tonia Osadebe, Tyce Walters, Wei Sun, Wendy Jiao, Woo Kim, Yi Ma
Izveidoja OpenAI San Francisco, Kalifornijā
Publicēts 2025. gada 30. septembrī

Autors

Sora komanda