Narito na ang Sora 2
Mas tumpak sa pisikal, realistic, at mas madaling kontrolin kaysa sa mga naunang system ang aming pinakabagong modelo para sa pagbuo ng video. Nagtatampok din ito ng naka-synchronize na dialogue at mga sound effect. Gumawa gamit ito sa bagong app ng Sora.
Simula Abril 26, 2026, hindi na available ang produktong Sora.
Ire-release namin ngayon ang Sora 2, ang flagship naming modelo para sa pag-generate ng video at audio.
Ang orihinal na modelo ng Sora mula sa Pebrero 2024 ay parang ang GPT‑1 para sa video—ito ang unang pagkakataon kung saan mukhang gumagana ang pag-generate ng video, at nagkaroon ng mga simpleng gawi tulad ng object permanence mula sa pag-scale up ng pre-training compute. Mula noon, nakatuon na ang team ng Sora sa pagsasanay ng mga modelo sa mga mas advanced na kakayahan sa pag-simulate ng mundo. Naniniwala kaming magiging mahalaga ang mga naturang system para sa pagsasanay ng mga modelo ng AI na lubos na nauunawaan ang pisikal na mundo. Isang mahalagang milestone para dito ang paggamay sa pre-training at post-training sa maramihang data ng video, na nasa unang yugto pa lang kumpara sa wika.
Prompt: figure skater performs a triple axle with a cat on her head
Sa Sora 2, direkta kaming tutungo sa palagay namin na puwedeng maging GPT‑3.5 para sa video. Kayang gawin ng Sora 2 ang mga napakahirap na bagay—at talagang imposible sa ilang pagkakataon—para sa mga naunang modelo ng pag-generate ng video: mga gymnastics routine sa Olympics, mga backflip sa paddleboard na tumpak na ipinapakita ng dynamics ng buoyancy at rigidity, at mga triple axel habang mahigpit na kumakapit ang isang pusa upang hindi mahulog.
Prompt: a guy does a backflip
Napaka-optimistic ng mga naunang modelo ng video—imo-morph ng mga ito ang mga bagay-bagay at babaguhin ng mga ito ang realidad para maisagawa ang isang text prompt. Halimbawa, kung hindi mashu-shoot ng isang manlalaro ng basketball ang bola, maaaring kusang mag-teleport ang bola sa ring. Sa Sora 2, kung hindi mashu-shoot ng isang manlalaro ng basketball ang bola, magre-rebound ito sa backboard. Kapansin-pansing madalas na mga pagkakamali pala ng internal na agent na implicit na ginagamit ng Sora 2 ang “mga pagkakamali” na ginagawa ng modelo; bagama't hindi pa rin ito perpekto, mas nasusunod nito ang laws of physics kumpara sa mga naunang system. Napakahalagang kakayahan nito para sa anumang kapaki-pakinabang na simulator—dapat mong magawa ang pagpalya, hindi lang ang pagtatagumpay.
May kapansin-pansin ding pagpapabuti ang modelong ito sa kakayahang kontrolin, at kaya nitong sundin ang mga detalyadong tagubilin para sa maraming shot habang tumpak na pinapanatili ang anyo ng mundo. Napakahusay nito sa mga makatotohanan, cinematic, at pang-anime na style.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Bilang system sa pag-generate ng video at audio na may pangkalahatang layunin, kaya nitong gumawa ng mga kumplikadong background soundscape, speech, at mga sound effect na napakamakatotohanan.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Puwede ka ring direktang maglagay ng mga element ng totoong mundo sa Sora 2. Halimbawa, sa pamamagitan ng panonood ng video ng isa sa mga teammate namin, puwedeng ilagay ng modelo ang mga ito sa anumang environment na nabuo ng Sora nang may tumpak na pagsasalarawan ng hitsura at boses. Napakapangkalahatan ng kakayahang ito, at magagamit ito sa sinumang tao, o anumang hayop o bagay.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Hindi pa perpekto ang modelo at marami itong pagkakamali, ngunit patunay ito na inilalapit tayo sa pag-simulate ng realidad ng lalo pang pag-scale up ng mga neural network sa data ng video.
Sa daan patungo sa pag-simulate para sa pangkalahatang layunin at mga AI system na magagamit sa pisikal na mundo, sa palagay namin ay lubos na masisiyahan ang mga tao sa mga modelong binubuo namin.
Sinimulan naming paglaruan ang feature na “i-upload ang iyong sarili” ilang buwan na ang nakalipas sa Sora team, at natuwa kaming lahat dito. Para itong natural na ebolusyon ng komunikasyon—mula sa mga text message na naging mga emoji, na naging mga voice note, at ito naman ngayon.
Kaya ngayon, maglulunsad kami ng bagong social iOS app na tinatawag lang na “Sora,” na pinapagana ng Sora 2. Sa loob ng app, puwede kang gumawa, mag-remix ng mga generation ng bawat isa, tumuklas ng mga bagong video sa nako-customize na feed ng Sora, at isama ang sarili mo o ang mga kaibigan mo sa pamamagitan ng feature na tinatawag na “mga tauhan”. Sa mga tauhan, puwede mong ilagay ang sarili mo mismo sa anumang eksena sa Sora nang may kamangha-manghang fidelity pagkatapos ng minsanang pag-record ng maikling video at audio sa app para beripikahin ang iyong pagkakakilanlan at makuha ang hitsura mo.
Noong nakaraang linggo, inilunsad namin ang app sa buong OpenAI. Sinabi sa amin ng aming mga kasamahan na nagkaroon sila ng mga bagong kaibigan sa kumpanya dahil sa feature. Sa palagay namin, ang social app na binuo batay sa feature na ito na “mga tauhan” ang pinakamabuting paraan para maranasan ang husay ng Sora 2.
Pinakapriyoridad namin ang mga alalahanin tungkol sa doomscrolling, adiksyon, isolation, at mga RL-sloptimized feed—narito ang ginagawa namin tungkol dito.
Binibigyan namin ang mga user ng mga tool at opsyon para kontrolin kung ano ang nakikita nila sa feed. Gamit ang mga kasalukuyang malaking modelo ng wika ng OpenAI, bumuo kami ng bagong klase ng mga algorithm na nagbibigay ng rekomendasyon na puwedeng turuan sa pamamagitan ng natural na pananalita. Mayroon din kaming mga built-in na mekanismo para pana-panahong tanungin ang mga user tungkol sa kanilang kalagayan at proactive silang bigyan ng opsyong i-adjust ang kanilang feed.
Bilang default, nagpapakita kami sa iyo ng content na lubos na naimpluwensyahan ng mga taong fina-follow o nakakasalamuha mo, at inuuna namin ang mga video na sa palagay ng modelo ay pinakamalamang na gagamitin mong inspirasyon para sa mga sarili mong gawa. Hindi kami nag-o-optimize para sa tagal na ginugugol sa feed, at malinaw naming idinisenyo ang app para i-maximize ang paggawa, hindi ang pagkonsumo. Makakakita ka pa ng mga detalye sa aming Pilosopiya ng Feed
Ang app na ito ay ginawa para gamitin kasama ang mga kaibigan mo. Sinasabi sa napakaraming feedback mula sa mga tester na ang mga tauhan ang dahilan kung bakit naiiba at masaya itong gamitin—kailangan mo itong subukan para talagang maunawaan mo ito, pero bago at natatangi itong paraan para makipag-ugnayan sa mga tao. Ilulunsad namin ito bilang app na nakabatay sa imbitasyon para tiyaking isasama mo ang iyong mga kaibigan. Sa panahon kung kailan lumalayo sa social graph ang lahat ng pangunahing platform, sa palagay namin, palalakasin ng mga tauhan ang komunidad.
Mahalaga sa amin ang pagprotekta sa kapakanan ng mga tinedyer . Maglalagay kami ng mga default na limitasyon sa kung ilang generation ang makikita ng mga tinedyer kada araw sa feed, at magpapatupad din kami ng mas mahihigpit na pahintulot para sa mga tauhan para sa grupong ito. Bukod pa sa aming naka-automate na stack para sa kaligtasan, pinapalaki namin ang mga team ng mga human moderator para mabilis na suriin ang mga kaso ng pambu-bully kung magkakaroon ng mga ito. Ilulunsad namin ang mga kontrol ng magulang sa Sora sa pamamagitan ng ChatGPT para magawa ng mga magulang na i-override ang mga walang katapusang limitasyon sa pag-scroll, i-off ang pag-personalize ng algorithm, pati na rin pamahalaan ang mga setting ng direct message.
Sa mga tauhan, ikaw ang may ganap na kontrol sa iyong pagkakahawig gamit si Sora. Ikaw lang ang magpapasya kung sino ang puwedeng gumamit ng iyong tauhan, at puwede mong bawiin ang access o alisin ang anumang video na kasama ito anumang oras. Puwede mong mapanood anumang oras ang mga video na naglalaman ng tauhan mo, kabilang ang mga draft na ginawa ng ibang tao.
Marami na kaming tinalakay na paksa sa kaligtasan sa app na ito—pahintulot sa paggamit ng pagkakahawig, provenance, pagpigil sa pag-generate ng mapaminsalang content, at marami pang iba. Tingnan ang aming dokumento sa Kaligtasan ng Sora 2 para sa iba pang detalye.
Nagmumula ang maraming problema sa iba pang app sa modelo ng pag-monetize kung saan binibigyan ng insentibo ang mga pasyang hindi nakabubuti sa user. Sa totoo lang, ang plan lang namin ngayon ay bigyan ang mga user ng opsyong magbayad para mag-generate ng karagdagang video kung masyadong malaki ang demand kumpara sa available na compute. Habang nagbabago ang app, hayagan naming ipapaalam ang anumang pagbabago sa aming diskarte rito, habang ang pagpapanatili ng kapakanan ng user pa rin ang pangunahing layunin namin.
Nasa simula pa lang tayo ng paglalakbay na ito, pero sa lahat ng makapangyarihang paraan ng paggawa at pag-remix ng content gamit ang Sora 2, nakikita namin ito bilang simula ng ganap na bagong panahon para sa co-creative na mga karanasan. Optimistiko kami na ito ay magiging mas malusog na platform para sa libangan at pagkamalikhain kumpara sa kung ano ang mayroon ngayon. Inaasahan namin na magkaroon ka ng isang mahusay na oras :)
Puwede nang i-download ngayon ang Sora iOS app(magbubukas sa bagong window). Puwede kang mag-sign up sa in-app para sa push notification kapag nagbukas ang access para sa account mo. Sinisimulan namin ang paunang paglulunsad sa U.S. at Canada ngayon na may layuning mabilis na mapalawak sa iba pang mga bansa. Pagkatapos mong makatanggap ng imbitasyon, magagawa mo ring ma-access ang Sora 2 sa pamamagitan ng sora.com(magbubukas sa bagong window). Ang Sora 2 ay unang magiging available nang libre, na may maluluwag na limitasyon para makapagsimula ang mga tao sa malayang pag-explore sa mga kakayahan nito, kahit na sakop pa rin ito ng mga limitasyon sa pag-compute. Magagamit din ng mga user ng ChatGPT Pro ang aming pang-eksperimento, na may mas mataas na kalidad na modelo ng Sora 2 Pro sa sora.com(magbubukas sa bagong window) (at malapit na rin sa Sora app). Plano rin naming ilabas ang Sora 2 sa API. Mananatiling available ang Sora 1 Turbo, at ang lahat ng ginawa mo ay magpapatuloy na nakaimbak sa iyong sora.com(magbubukas sa bagong window) library.
Ang mga modelo ng video ay nagiging napakabilis na gumagaling. Ang mga general-purpose world simulator at robotic agent ang pangunahing huhubog sa lipunan at magpapabilis sa takbo ng pag-unlad ng sangkatauhan. Kinakatawan ng Sora 2 ang makabuluhang pag-unlad tungo sa layuning iyon. Alinsunod sa misyon ng OpenAI, mahalaga na makinabang ang sangkatauhan mula sa mga modelong ito habang binubuo ang mga ito. Sa tingin namin, magbibigay ang Sora lubos na kagalakan, pagkamalikhain, at koneksyon sa mundo.
— Isinulat ng Sora Team
Pangunahing Target at Mga Visual
Unang pagbasa: isang dragon na dumadaan sa pagitan ng matutulis na ice spires, ang mga vortex sa dulo ng pakpak ay nagbabalat ng spindrift; pangalawang pagbasa: ang napunit na yelo ng glacier ay bumabagsak patungo sa isang cobalt fjord, na may kulay amber na gilid ng araw na humahalik sa hamog na nagyelo sa mga kaliskis; Ang ekspresyon ay nagpapahiwatig ng mapanligaw na kalmadong kilos / walang kahirap-hirap na kapangyarihan.
Format at Hitsura
5.0s; 4K; 180° shutter; emulasyon ng malakihang digital sensor na may malinaw na micro-contrast; napakapinong butil; kontroladong halation sa kislap ng niyebe; walang gate weave.
Mga Lente at Pag-filter
Hero: 50mm spherical sa nose-mount na gyro-stabilized aerial platform (parallel tracking na may bahagyang papasok na arko). Pag-filter: Black Pro-Mist 1/8; ang pabilog na polarizer ay nagse-set ng liwanag para bawasan ang silaw ng niyebe habang pinapanatili ang kislap ng mga specular.
Grade / Palette
Mga highlight: malinis na puting yelo na may cool roll-off; Gitna: glacier na kulay asero-asul at maputlang cyan na hangin; Mga anino: slate/teal na may napanatiling detalye ng crevasse; mainit na amber rim sa mga gilid ng dragon para sa paghihiwalay; siksik ang mga specular sa hamog na nagyelo/scale.
Pag-iilaw at Atmospera
Mababang sikat ng araw sa hapon; katabatic wind na nagtataas ng spindrif; manipis at nagyeyelong hamog sa lalim; pasulput-sulpot na pagsabog ng alikabok ng yelo kasunod ng pag-ihip nito; mahinang singaw mula sa dragon habang nagsusumikap.
Lokasyon at Pag-frame
Mataas na serac field at matutulis na ridgeline; ang camera ay sumusunod sa bilis ng dragon sa gitnang altitud, ang mga diagonal ng glacier ay humihila pabalik patungo sa fjord; ang mga ice fin sa unahan ay dumaraan malapit para sa parallax; walang estrukturang pantao.
Wardrobe / Props / Mga Note ng Sasakyan
Hindi naaangkop (nilalang). Hitsura ng ibabaw: matte na mga horn ridge, semi-iridescent na mga plate ng kaliskis na may micro-frost sa mga nangungunang gilid.
Tunog
Malakas na high-air wind shear, ang membrane ng pakpak ay kumakalampag sa bawat palo, kristal na tunog ng yelo mula sa mga serac, malayong pagbagsak ng glacier na may malakas na dagundong; mabilis na hininga/pag-ungol mula sa dragon: “Rrhh—” (mas mababa sa 1 segundo). Walang puntos—purong diegetic na pagkamangha.
Na-optimize na Listahan ng mga Kuha (1 kuha / 5.0s)
0.0–5.0 — “Parallel Ridge Carve” (50mm, nose-mount aerial na may bahagyang paloob na arc at micro-push)
Sinusundan natin ang dragon habang dumadaan ito sa corridor ng mga ice spire; ang wingtip vortices ay nagtatanggal ng spindrift na nagiging mga ribbon; ang fragment mula sa calving ay bumabagsak sa malayo, nagbubuga ng powder plume; unti-unting lumalapit ang camera—nakikita ang mga kaliskis, nagliliwanag ang amber rim—pagkatapos ay lumilihis ang dragon patungo sa fjord, nagkikiskisan ang buntot, nagbubuo ng malawak na anino sa ibabaw ng glacier.
Layunin: Ihatid ang mythic scale na may tactile realism sa isang mapagpasyang pasada—bilis, masa, at elemental na lamig.
Mga Tala ng Camera (Bakit Ito Binabasa)
Binabalanse ng 50mm ang presensya ng nilalang at sukat ng tanawin nang hindi mini-miniaturize; ang parallel track + inward arc ay nagpapakita ng bilis at hugis; micro-push na may pinakamalakas na downstroke para sa power punctuation; kinokontrol ng light polarizer ang glare habang pinapanatili ang kislap; ang back/rim sun ay naghuhubog ng silhouette; ang malapit na pagdaan sa mga ice fin ay nagbibigay ng mga parallax speed cue.
Pagtatapos
Napakahusay na butil (~15%); minimal ang halation sa mga snow specular; banayad na print emulation para panatilihing makatotohanan ang mga asul at mayaman ang mga itim; multiband dynamics para mapanatili ang tunog ng hampas ng pakpak nang hindi natatabunan ang calving boom; poster frame: ang dragon ay nakalihis sa isang sinag ng araw na serac, spindrift na umaagos, at ang fjord ay nagliliyab ng malalim na asul sa likuran.
Sora 2
Debbie Mesloh
Caroline Zhao
Nailathala Setyembre 30, MMXXV


