No 2026. gada 26. aprīļa Sora produkts vairs nav pieejams.
Šodien mēs izlaižam Sora 2, mūsu vadošo video un audio ierakstu ģenerēšanas modeli.
Sākotnējais Sora modelis 2024. gada februārī daudzējādā ziņā bija GPT‑1 brīdis video—pirmo reizi video ģenerēšana šķietami sāka darboties, un, palielinot iepriekšējas apmācības aprēķinu apjomu, parādījās tādas vienkāršas normas kā objektu pastāvība. Kopš tā laika Sora komanda ir koncentrējusies uz mācību modeļiem ar modernākām pasaules simulācijas iespējām. Mēs uzskatām, ka šādas sistēmas būs ļoti svarīgas, lai apmācītu mākslīgā intelekta modeļus, kas padziļināti izprot fizisko pasauli. Būtisks pagrieziena punkts šajā jomā ir priekšapmācības un pēcapmācības veikšana attiecībā uz liela apjoma video datiem, kas salīdzinājumā ar valodu ir tikai sākuma stadijā.
Prompt: figure skater performs a triple axle with a cat on her head
Ar Sora 2, mēs tieši pārejam uz to, kas, mūsuprāt, varētu būt GPT‑3.5 brīdis video. Sora 2 var paveikt lietas, kas ir ārkārtīgi sarežģītas—un dažos gadījumos pilnīgi neiespējamas—iepriekšējo video paaudžu modeļiem: olimpiskās vingrošanas rutīnas, atpakaļsalto uz airu dēļa, kas precīzi modelē peldspējas un noturības dinamiku, un trīskāršus kaķa akselus kopā ar slidotāju.
Prompt: a guy does a backflip
Iepriekšējie video modeļi ir pārāk optimistiski — tie pārveido objektus un deformē realitāti, lai veiksmīgi izpildītu teksta uzvedni. Piemēram, ja basketbolists netrāpa metienu, bumba var spontāni teleportēties uz grozu. Sora 2, ja basketbolists netrāpa metienu, bumba atsitīsies pret vairogu. Interesanti, ka modeļa “kļūdas” bieži šķiet iekšējā aģenta kļūdas, ko Sora 2 netieši modelē. Lai gan joprojām nepilnīgs, šis modelis labāk ievēro fizikas likumus, salīdzinot ar iepriekšējām sistēmām. Šī ir ārkārtīgi svarīga spēja jebkuram lietderīgam pasaules simulatoram—tam ir jāspēj modelēt ne tikai panākumus, bet arī neveiksmes.
Modelis ir arī liels solis uz priekšu kontrolējamības ziņā, spējot izpildīt sarežģītus norādījumus, kas aptver vairākus kadrus, vienlaikus precīzi saglabājot pasaules stāvokli. Tam ir izcilas spējas reālistisku, kinematogrāfisku un anime stilu jomā.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Kā vispārējas nozīmes video-audio ģenerēšanas sistēma, tā spēj izveidot sarežģītas fona skaņu ainavas, sarunas un skaņas efektus ar augstu reālisma pakāpi.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Tu vari arī tieši ievietot reālās pasaules elementus Sora 2. Piemēram, noskatoties kāda mūsu komandas biedra video, modelis var viņu ievietot jebkurā Sora ģenerētā vidē ar precīzu izskata un balss attēlojumu. Šī spēja ir ļoti vispārīga un darbojas ar jebkuru cilvēku, dzīvnieku vai objektu.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Modelis ir tālu no ideāla un pieļauj daudz kļūdu, taču tas apliecina, ka turpmāka neironu tīklu paplašināšana video datos mūs tuvina realitātes simulācijai.
Mēs uzskatām, ka ceļā uz vispārējas nozīmes simulācijas un mākslīgā intelekta sistēmām, kas var darboties fiziskajā pasaulē, cilvēki var gūt daudz prieka, izmantojot mūsu pašreizējos modeļus.
Mēs pirmo reizi sākām spēlēties ar šo funkciju "augšupielādē sevi" pirms vairākiem mēnešiem Sora komandas ietvaros, un mēs visi bijām sajūsmā. Tā šķita kā dabiska komunikācijas evolūcija - sākot no īsziņām, emocijzīmēm un balss ziņām līdz šai iespējai.
Šodien mēs laižam klajā jaunu sociālo iOS lietotni ar nosaukumu “Sora”, ko nodrošina Sora 2. Šajā lietotnē jūs varat izveidot videoklipus, pārveidot viens otra ģenerētos darbus, atklāt jaunus videoklipus pielāgojamā Sora plūsmā un pievienot sevi vai savus draugus, izmantojot funkciju ar nosaukumu “tēli”. Ar tēliem tu vari nekavējoties iejusties jebkurā Sora ainā ar ievērojamu precizitāti pēc īsa vienreizēja video un audio ieraksta uzņemšanas lietotnē, lai verificētu savu identitāti un iemūžinātu savu līdzību.
Pagājušajā nedēļā visi OpenAI darbinieki uzsāka lietotnes iekšēju izmantošanu. Mēs jau esam dzirdējuši, ka mūsu kolēģi uzņēmumā iegūst jaunus draugus, pateicoties šim līdzeklim. Mēs uzskatām, ka sociālā lietotne, kas veidota ap šo “tēlu” funkciju, ir labākais veids, kā izbaudīt Sora 2 burvību.
Bažas par doomscrollingu, atkarību, izolāciju un RL-sloptimizētām plūsmām ir būtiskas—lūk, ko mēs darām, lai šīs problēmas risinātu.
Mēs sniedzam lietotājiem rīkus un izvēles iespējas, lai viņi varētu kontrolēt saturu savā plūsmā. Izmantojot OpenAI esošos lielos valodu modeļus, mēs esam izstrādājuši jaunu ieteikšanas algoritmu klasi, kurus var vadīt ar dabisko valodu. Mums ir arī iebūvēti mehānismi, kas ļauj periodiski aptaujāt lietotājus par viņu labklājību un proaktīvi dot iespēju pielāgot plūsmu.
Pēc noklusējuma mēs rādām saturu, kas ir tieši saistīts ar cilvēkiem, kuriem tu seko vai ar kuriem mijiedarbojies, un piedāvājam videoklipus, kurus, pēc modeļa domām, tu varētu izmantot kā iedvesmu saviem radošajiem darbiem. Mēs necenšamies mākslīgi palielināt laiku, kas pavadīts plūsmā – mēs izveidojām šo lietotni, lai maksimāli veicinātu radošumu, nevis patēriņu. Vairāk informācijas vari atrast mūsu Plūsmas filozofijā
Šī lietotne ir paredzēta izmantošanai kopā ar taviem draugiem. Mēs saņemam pārliecinošas atsauksmes no testētājiem, ka tēli ir tie, kas padara šo lietotni atšķirīgu un aizraujošu. Tev tā ir jāizmēģina, lai to patiešām saprastu, jo tas ir jauns un unikāls veids, kā sazināties ar cilvēkiem. Mēs to izlaižam kā lietotni, kas balstīta uz ielūgumiem, lai nodrošinātu, ka tu sāc to lietot kopā ar saviem draugiem. Šobrīd, kad visas lielās platformas attālinās no sociālā aspekta, mēs uzskatām, ka tēli stiprinās kopienas saikni.
Mums ir svarīga pusaudžu labklājības aizsardzība . Mēs ieviešam noklusējuma ierobežojumus tam, cik daudz ģenerētā satura pusaudži var redzēt plūsmā dienā, un šai grupai arī ieviešam stingrākas atļaujas attiecībā uz tēliem. Papildus mūsu automatizētajām drošības sistēmām mēs paplašinām cilvēku moderatoru komandas, lai ātri pārskatītu bulinga gadījumus, ja tādi rodas. Mēs palaižam Sora vecāku kontroli ChatGPT platformā, lai vecāki varētu atcelt bezgalīgas ritināšanas ierobežojumus, izslēgt algoritma personalizāciju, kā arī pārvaldīt tiešo ziņojumu iestatījumus.
Ar tēliem tu kontrolē savu līdzību no sākuma līdz beigām Sora platformā Tikai tu izlem, kas var izmantot tavu tēlu, un tu jebkurā laikā vari atcelt piekļuvi vai izņemt jebkuru videoklipu, kurā tas ir iekļauts. Tu vari jebkurā laikā apskatīt videoklipus, kuros ir redzams tavs tēls, tostarp citu personu izveidotos projektus.
Šajā lietotnē esam pievērsušies daudziem drošības aspektiem, tādiem kā piekrišana līdzības izmantošanai, izcelsme, kaitīga satura radīšanas novēršana un daudziem citiem jautājumiem. Plašāku informāciju lasi mūsu Sora 2 drošības dokumentā.
Daudzas problēmas ar citām lietotnēm rodas monetizācijas modeļa dēļ, kas mudina pieņemt lēmumus, kas ir pretrunā ar lietotāju labklājību. Mūsu vienīgais pašreizējais plāns acīmredzami ir ar laiku piedāvāt lietotājiem iespēju maksāt noteiktu summu, lai ģenerētu papildu videoklipus, gadījumā, ja radīsies pārāk liels pieprasījums salīdzinājumā ar pieejamo skaitļošanas jaudu. Lietotnei attīstoties, mēs šeit atklāti paziņosim par jebkādām izmaiņām, vienlaikus saglabājot lietotāju labklājību kā galveno mērķi.
Mēs pagaidām esam tikai šī ceļojuma sākumā, taču, ņemot vērā visas milzīgās iespējas radīt un remiksēt saturu ar Sora 2, mēs uzskatām, ka šis ir pilnīgi jaunas ēras sākums koprades pieredzes veidošanā. Mēs ticam, ka šī būs veselīgāka platforma izklaidei un radošai izpausmei, salīdzinot ar to modeli, kas ir pieejams pašlaik. Mēs ceram, ka tu lieliski pavadīsi laiku :)
Sora iOS lietotne(atveras jaunā logā) tagad ir pieejama lejupielādei. Tu vari reģistrēties lietotnē, lai saņemtu pašpiegādes paziņojumu, kad tiks atvērta piekļuve tavam kontam. Mēs sākam ar ASV un Kanādu un plānojam drīzumā paplašināt piekļuvi arī citās valstīs. Pēc ielūguma saņemšanas tu varēsi piekļūt Sora 2 arī vietnē sora.com(atveras jaunā logā). Sākotnēji Sora 2 būs bez maksas ar elastīgiem ierobežojumiem, lai lietotāji varētu brīvi izpētīt visas iespējas, taču skaitļošanas jaudas ierobežojumi joprojām ir spēkā. ChatGPT Pro lietotāji varēs izmantot arī mūsu eksperimentālo, augstākas kvalitātes Sora 2 Pro modeli vietnē sora.com(atveras jaunā logā) (un drīz arī Sora lietotnē). Mēs plānojam izlaist Sora 2 arī API platformā. Sora 1 Turbo turpina darboties, un viss, kas līdz šim ir izveidots, būs pieejams tavā sora.com(atveras jaunā logā) bibliotēkā.
Video modeļi ļoti ātri attīstās un progresē. Vispārējas nozīmes pasaules simulatori un robotizēti aģenti būtiski ietekmēs sabiedrību un paātrinās cilvēces progresa gaitu. Sora 2 ir nozīmīgs solis šī mērķa sasniegšanā. Saskaņā ar OpenAI misiju ir svarīgi panākt, ka cilvēce gūst labumu no šiem modeļiem to izstrādes laikā. Mēs uzskatām, ka Sora sagādās daudz prieka, radošuma un nodošinās saikni ar pasauli.
— sagatavoja Sora Team
Primārais mērķis un vizuālais tēls
Pirmais iespaids: pūķis brāžas pāri robainām ledus smailēm, spārnu vēdas sagriež sniegu vērpetēs; otrais iespaids: ledāja plaisas atsedz kobalta zilu fjordu un dzintara krāsas saules stari glāsta apsarmojušas zvīņas uz pūķa ķermeņa; izteiksmes iespaids parāda plēsēja mieru/klusu spēku.
Formāts un izskats
5.0 s; 4 K; 180 ° aizvars; lielformāta digitālā sensora emulācija ar izteiktu mikrokontrastu; sīkgraudains attēls; ierobežota halācija uz sniega atspīdumiem; bez lentes pārejas.
Objektīvi un filtrēšana
Hero: 50 mm sfēriskais objektīvs uz priekšpusē uzstādītas žiroskopiski stabilizētas antenas platformas (paralēla izsekošana ar nelielu iekšēju loku). Filtrēšana: Black Pro-Mist 1/8; apļveida polarizators iestata gaismu, lai mazinātu sniega atspīdumu, vienlaikus saglabājot mirdzošu dzirksti.
Pakāpe/palete
Izcēlumi: tīrs ledus baltums ar vēsu vertikāli; vidustoņi: tērauda zils ledājs un gaišas ciāna krāsas debesis; ēnas: šīfera/zilganzaļa krāsa ar dziļām ledāju plaisām; silta dzintara krāsas pūķa kontūru mala tēla nošķiršanai; spoguļstari virzīti uz apledojumu/zvīņām.
Apgaismojums un atmosfēra
Vēla pēcpusdiena, zemu saules staru atspīdums; katabātisks vējš saceļ sniega vērpetes; smalka, sasalusi migla dziļuma efektam; tam sekojoši periodiski ledus putekļu uzplaiksnījumi; maigi piepūles radīti pūķa izelpas izgarojumi
Atrašanās vieta un kadrēšana
Augstu ledus grēdu virsotņu lauks un naža asmenim līdzīgas kores; kamera seko pūķim vienādā ātrumā vidējā augstumā, ledāja diagonāles ved fjorda virzienā; priekšplāna ledus vērpetes šaujas tuvu garām paralakses efektam; nav cilvēku veidotu būvju.
Garderobe / rekvizīti / transportlīdzekļu piezīmes
N/A (radība). Virsmas iespaids: matētas kalnu virsotnes, viegli zaigojošas zvīņas ar nelielu priekšējās daļas apsarmojumu.
Skaņa
Augstu gaisa masu vēja brāzmas, spārnu membrānas švīkoņa katrā spārnu nolaišanas brīdī, kristāliska ledus plīšanas/sērsnas garozas lūšanas skaņa, attāla ledāju brukšanas duna; strauja pūķa izelpa/rūciens: "Rrhh-" (sub-1s). Nav vērtējuma — patiesa dieģētiska bijība.
Optimizēts kadru saraksts (1 kadrs / 5,0 s)
0,0–5,0 — “Parallel Ridge Carve” (50 mm, priekšpusē stiprināta antenas platforma ar nelielu iekšējo loku un mikrospiedienu)
Mēs sekojam pūķim, kas brāžas pāri ledus smailēm aiz sevis atstājot samalta sniega virpuļu astes; tālu aizā iekrīt ledus atlūza, radot putekļu mākoni; kamera pietuvojas tuvāk—zvīņu izskats, dzintara krāsas kontūru apveids—tad pūķis pagriežas fjorda virzienā, aste aizšķērso skatu metot plašu ēnu pār ledāju.
Mērķis: nodrošināt mītisku mērogu un taustāmu reālismu vienā izšķirošā piegājienā - ātrums, masa un stihisks aukstums.
Kameras piezīmes (ko tā nolasa)
50 mm līdzsvaro radības klātbūtni un ainavas mērogu, neminiaturizējot; paralēlais celiņš + iekšējais loks nodrošina ātrumu un formu; mikrospiešanas laiki ar spēcīgiem lejupvērstiem vēzieniem jaudas akcentam; gaismas polarizators kontrolē atspīdumu, vienlaikus saglabājot mirdzumu; aizmugurē esošais saules loks veido siluetu; tuvu lidojošās ledus vērpetes rada paralakses ātruma sajūtu.
Apdare
Ļoti smalka graudainība (~15%); minimāla sniega atspīduma halācija; viegla emulācija, lai saglabātu zilo toņu reālismu un piesātinātus melnos toņus; daudzjoslu dinamika, lai saglabātu spārnu švīkoņu, neslāpējot to nolaišanās dunu; kadra ietvars: pūķis slīd pāri saules apspīdētai sērsnai, vējš sagriežas vērpetēs, tālē kvēlojoši zils fjords.
Sora 2
Debbie Mesloh
Caroline Zhao
Publicēts 2025. gada 30. septembrī


