Gå direkt till huvudinnehåll
OpenAI

30 september 2025

ForskningLanseringProdukt

Sora 2 är här

Vår senaste videogenereringsmodell är mer fysiskt korrekt, realistisk och lättare att kontrollera än tidigare system. Den har även funktioner som synkroniserad dialog och ljudeffekter. Skapa med den i den nya Sora-appen.

Laddar …

Från och med 2026-04-26 är Sora-produkten inte längre tillgänglig.


I dag lanserar vi Sora 2, vår flaggskeppsmodell för video- och ljudgenerering.

Den ursprungliga Sora-modellen från februari 2024 var på många sätt GPT‑1‑ögonblicken för video: första gången det kändes som om videogenerering fungerade, och enkla beteenden som objektpermanens utvecklades när vi skalat upp förträningens beräkningskapacitet. Sedan dess har Sora-teamet fokuserat på att träna modellerna med en mer avancerad världssimuleringskapacitet. Vi tror att sådana system kommer att vara avgörande för att träna AI-modeller som har en djupare förståelse av den fysiska världen. En viktig milstolpe i denna process är behärskandet av förträning och efterträning på stora mängder videodata, något som ännu är i sin linda jämfört med språk.

Prompt: figure skater performs a triple axle with a cat on her head

Med Sora 2 går vi direkt till vad vi tror kan vara GPT‑3.5‑ögonblicket för video. Sora 2 kan utföra saker som är extremt svåra – och i vissa fall helt omöjliga – för tidigare modeller för videogenerering: OS-gymnastikprogram och bakåtvolter på en paddelbräda som på ett korrekt sätt visar flytkraftens och styvhetens dynamik och en konståkare som gör trippelaxlar medan en katt håller i sig för glatta livet.

Prompt: a guy does a backflip

De tidigare videomodellerna är överoptimistiska – de förändrar föremålens form och förvränger verkligheten för att följa en textprompt. Om en basketspelare till exempel missar ett skott kan bollen spontant teleportera sig ner i korgen. I Sora 2 studsar bollen mot målbrädan om basketspelaren missar ett skott. Intressant nog verkar de ”misstag” som modellen gör ofta vara misstag i den interna agent som Sora 2 implicit avbildar. Även om den fortfarande inte är perfekt är den bättre på att följa fysikens lagar än tidigare system. Det här är en oerhört viktig förmåga hos en användbar världssimulator; den måste kunna modellera misslyckanden, inte bara framgångar.

Modellen tar även ett stort steg framåt vad gäller kontrollförmågan. Den kan följa invecklade instruktioner som omfattar flera scener och ändå återge världen på ett korrekt sätt. Den utmärker sig när det gäller realistiska och filmiska stilar samt anime.

Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...

När Sora 2 används som ett allmänt video- och ljudgenereringssystem kan den skapa sofistikerade bakgrundsljudlandskap, tal och ljudeffekter som upplevs som mycket verkliga.

Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time

Man kan även lägga in element från den riktiga världen direkt i Sora 2. Genom att till exempel titta på en video med en av våra teammedlemmar kan modellen föra in personen i en Sora-genererad miljö och återge såväl utseende som röst på ett korrekt sätt. Det här är en allmän funktion som fungerar för människor, djur och föremål.

Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much

Modellen är långt ifrån perfekt och begår många misstag, men den visar att en ytterligare utbyggnad av de neurala nätverken med videodata för oss närmare en simulering av verkligheten.

Driftsättning av Sora 2

På vägen mot allmän simulering och AI-system som fungerar i den fysiska världen tror vi att användarna kan ha roligt med de modeller vi bygger under resans gång.

Sora-teamet började experimentera med ”ladda upp dig själv”- funktionen för flera månader sedan och hade hur roligt som helst. Det kändes som nästa naturliga kommunikationssteg; från textmeddelanden till emojis till röstmeddelanden och nu till detta.

Så idag lanserar vi en ny social iOS-app som heter ”Sora”, som drivs av Sora 2. I appen kan man skapa och omskapa varandras genereringar, upptäcka nya videor i det anpassningsbara Sora-flödet och föra in sig själv eller sina vänner via en funktion som kallas ”karaktärer”. Karaktärer innebär att du kan föra in dig själv i vilken Sora-scen som helst med ett otroligt naturtroget resultat efter en kort engångsinspelning med bild och ljud i appen för att bekräfta din identitet och göra en avbild av ditt utseende.

Förra veckan lanserade vi appen internt på hela OpenAI. Våra kollegor har redan berättat att de har lärt känna nya vänner på företaget tack vare funktionen. Vi tycker att en social app som bygger på funktionen ”karaktärer” är det bästa sättet att uppleva det magiska med Sora 2.

En ansvarsfull lansering

Farhågor om domedagsskrollande, skärmberoende, isolering och RL-flöden som är optimerade med övervakad inlärning är fullt förståeliga. Så här hanterar vi dem.

Vi ger användarna verktyg och alternativ som gör att de kan styra vad de ser i flödet. Med hjälp av OpenAI:s stora befintliga språkmodeller har vi tagit fram en ny typ av rekommendationsalgoritm som kan instrueras genom naturligt språk. Vi har även inbyggda mekanismer som då och då frågar användarna hur de mår och i ger dem möjligheten att anpassa sitt flöde i förebyggande syfte.

Som standard visar vi innehåll som till stora delar kan kopplas till personer du följer eller interagerar med, och prioriterar videor som modellen tror att du troligen kommer att använda som inspiration när du själv ska skapa. Vi fokuserar inte på att du ska stanna så länge som möjligt i flödet, utan har medvetet utformat appen för att maximera den kreativa aspekten, inte konsumtionen. Du hittar mer information i vår Flödesfilosofi

Den här appen är gjord för att användas tillsammans med dina vänner. Den överväldigande responsen från våra testare är att det är karaktärer som får appen att sticka ut och gör den rolig att använda. Man måste prova den för att verkligen förstå, men det är ett nytt och unikt sätt att kommunicera med andra. Vi lanserar den som en inbjudningsbaserad app för att du ska få med dig dina vänner på tåget. I en tid när alla stora plattformar flyttar fokus från den sociala aspekten tror vi att karaktärer istället kan stärka gemenskapen.

För oss är det oerhört viktigt att ungdomar ska må bra. Vi inför standardgränser för hur många genereringar tonåringar kan se i flödet per dag och lanserar även striktare behörigheter för karaktärer för den här gruppen. Utöver våra automatiska säkerhetsstacks tillsätter vi mer personal i våra moderatorteam för att vid behov snabbt kunna granska mobbningsfall. Vi lanserar Sora med föräldrainställningar via ChatGPT, så att föräldrar kan kringgå oändliga skrollningsgränser, stänga av algoritmanpassning och hantera inställningarna för direktmeddelanden.

När det gäller karaktärer i Sora är det du som bestämmer hur ditt utseende används under hela processen. Endast du bestämmer vem som får använda din karaktär, och du kan när som helst återkalla åtkomsten eller när som helst ta bort videor där den finns med. Du kan när som helst se alla videor som innehåller karaktärer av dig, även utkast som skapats av andra.

Vi har tagit itu med många säkerhetsfrågor under arbetet med appen: samtycke till användning av utseenden, ursprung, förhindra att skadligt innehåll genereras, bland mycket annat. Mer information hittar du i vårt säkerhetsdokument för Sora 2.

Många av problemen med andra appar beror på en intäktsmodell som uppmuntrar till beslut som inverkar negativt på användarnas välmående. Vi vill vara öppna med att vår enda plan i nuläget är att så småningom ge användarna alternativet att betala en liten summa för att generera en extra video om efterfrågan är för hög i förhållande till den tillgängliga beräkningskapaciteten. I takt med att vi utvecklar appen vidare meddelar vi om vårt tillvägagångssätt ändras, och vi kommer även i fortsättningen att sätta användarnas hälsa i främsta rummet.

Vi befinner oss i början av vår resa, men med tanke på att det finns många kraftfulla sätt att skapa och omskapa innehåll i Sora 2 ser vi detta som början på en helt ny epok för det kreativa samskapandet. Vi hoppas och tror att detta kommer att bli en sundare plattform för underhållning och kreativitet jämfört med det nuvarande utbudet. Mycket nöje! :)

Var du hittar Sora 2 och vad som händer härnäst

Sora-appen (iOS)(öppnas i ett nytt fönster) finns att ladda ner nu. Du kan registrera dig i appen, så får du ett pushmeddelande när ditt konto har åtkomst. Vi lanserar appen i USA och Kanada i dag och planerar att snabbt utöka lanseringen till fler länder. När du har fått en inbjudan kan du komma åt Sora 2 via sora.com(öppnas i ett nytt fönster). Till en början är Sora 2 gratis och har generösa gränser, så att användarna fritt kan utforska alla funktioner, även om dessa fortfarande omfattas av beräkningsbegränsningar. ChatGPT Pro-användare har även tillgång till vår experimentella Sora 2 Pro-modell med högre kvalitet på sora.com(öppnas i ett nytt fönster) (och snart även i Sora-appen). Vi planerar även att släppa Sora 2 i API:et. Sora 1 Turbo kommer fortfarande att vara tillgängligt, och allt du har skapat finns kvar i ditt bibliotek på sora.com(öppnas i ett nytt fönster).

Videomodellerna börjar bli riktigt bra – och det snabbt. Allmänna världssimulatorer och robotagenter kommer att stöpa om samhället i grunden och påskynda mänsklighetens framgångar. Sora 2 är ett viktigt steg mot det målet. I enlighet med OpenAI:s vision är det viktigt att mänskligheten gynnas av dessa modeller under arbetet med att utveckla dem. Vi tror att Sora kommer att skänka världen mycket glädje, kreativitet och gemenskap.

– Skrivet av Sora-teamet

Primärt mål och visuella element
Första intrycket: En drake flyger förbi taggiga isspiror, vingslagen får snön att virvla upp. Andra intrycket: Glaciärens spruckna is tonar ut i en koboltblå fjord, och frosten på drakens fjäll gnistrar i solen. Bilden förmedlar rovdjurets lugn och otvungna styrka.

Format och utseende
5,0 sekunder; 4K; 180° slutartid; emulering av digital filmsensor i stort format med skarp mikrokontrast; mycket finkornig; diskret halation på snöreflexer; ingen gate weave.

Linser och filtrering
Huvudtagning: 50 mm sfärisk lins på nosmonterad gyrostabiliserad flygplattform (parallell följning med lätt inåtböjd båge). Filtrering: Black Pro-Mist 1/8; cirkulärt polariseringsfilter lätt inställt för att dämpa snöblänk, samtidigt som spekulära reflektioner bevaras.

Gradering/Palett
Högdagrar: Ren isvit med sval övergång; Mellandagrar: Stålblå glaciär och blek cyanfärgad himmel; Skuggor: Skiffergrå/blågröna med bevarad detaljrikedom i glaciärsprickorna; Varm bärnstensfärgad kant på drakens silhuett för separation; De spekulära högdagrarna är koncentrerade på frost/fjäll.

Ljus och atmosfär
Sent eftermiddagsljus från låg sol i motljus; katabatisk vind som rör upp snövirvlar; tunt, isigt dis för djup; sporadiska virvlar av isstoft i drakens kölvatten; svag andningsånga från draken vid ansträngning.

Plats och komposition
Högt beläget serackfält och knivskarp bergskam; kameran följer draken i samma hastighet på medelhög höjd, glaciärens diagonaler leder tillbaka till fjorden; isflak i förgrunden passerar nära för parallax; inga mänskliga konstruktioner.

Kostym/Rekvisita/Fordonsanteckningar
Ej tillämpligt (varelse). Ytavläsning: Matta hornåsar, halvskimrande fjällplattor med mikrofrost längs framkanterna.

Ljud
Höghöjdsvindars turbulens, vingmembranens dunder vid varje vingslag, kristalliska knäppande och knakande ljud från istornen, avlägset dån från en kalvande glaciär; snabbt utandningsbrus/muller från draken: ”Rrhh—” (under 1 s). Ingen musik – bara hänförande ljud från själva scenen.

Optimerad tagninglista (1 tagning / 5,0 sek.)
0,0–5,0 – ”Parallell kamåkning” (50 mm, nosmonterad lufttagning med lätt inåtbåge och mikrorörelse inåt)
Vi håller jämna steg med draken när den tar sig fram genom en korridor av isspiror; vingspetsarna virvlar upp pudersnö som samlas i band; ett kalvande isblock faller långt nedanför och skickar upp en mjölkliknande plym; kameran glider närmare – fjällens struktur framträder, den bärnstensfärgade kanten flammar upp – sedan girar draken mot fjorden, svansen klipper genom luften och kastar en svepande skugga över glaciären.
Syfte: Förmedla en känsla av mytisk storslagenhet med taktil realism i en enda avgörande tagning – hastighet, massa och elementär kyla.

Kameraanteckningar (varför bilden fungerar)
50 mm balanserar varelsens närvaro med landskapets skala utan att förminska den; parallellspårning + inåtgåendebåge förstärker känslan av hastighet och form; mikrorörelse synkroniseras med det starkaste nedslaget, vilket ger en kraftfull accent; polariseringsfilter styr blänk, samtidigt som glittret bevaras; bak-/kantljus formar silhuetten; isfenor som passerar nära ger parallaxsignaler för fart.

Efterbearbetning
Mycket fin kornighet (~15 %); minimal halation på snöreflexer; mild printemulering för realistiska blåtoner och djupa svärtor; multibandsdynamik för att behålla vingslagets tyngd utan att det överröstar kalvningsdånet; affischram: draken girar över en solbelyst serac, snödrev i rörelse, fjorden i djupblå nyans i fjärran.

Sora 2

ResearchHarold Li, Dmytro Okhonko, Avi Verma, Eric Zhang, Ricky Wang, Troy Luhman, Eric Luhman, Bram Wallace, Eric Mintun, Michael Chang, Gabriel Petersson, Jure Zbontar, Daniel Geng, Will DePue, Alex Zhao, Cheng Lu, Yufei Guo, Pritam Damania, Larry Kai, Farzad Khorasani, Kenji Hata, James Betker, Vladimir Chalyshev, Connor Holmes, Aditya Ramesh, Bill Peebles
ProduktAndrew Kondrich, Andrew Sima, Andrew Thieck, Andrey Malevich, Antonio Di Francesco, Bin Wen, Bing Liang, Boyang Niu, Cheng Su, Cristina Scheau, Daniel Latta-Lin, David Schnurr, Dhruba Borthakur, Duc Tran, Gilman Tolle, Greg Hochmuth, Joe Taylor, Joey Flynn, Joey Pereira, Julius Hochmuth, Key Shin, Liam Esparraguera, Liang Wu, Liang Xiong, Mengchao Zhong, Michelle Hwang, Mick Jermsurawong, Mike Starr, Omar Elfanek, Patrick Hum, Pavel Komlev, Rajeev Nayak, Raunak Daga, Rohan Sahai, Sergii Rudenko, Shuyi Chen, Tarek Younes, Thomas Bredillet, Thomas Dimson, Victoria Huang, Vladimir Chalyshev, Welton Wang, Wesam Manassra, Xiaolong Wang, Yizhe Yu, Yun Jiang, Zhigang Wang
DeltagareAarash Heydari, Chad Nelson, Daniel Fradin, David Duxin, Hessam Bagherinezhad, Jasmyn Samaroo, Jay Wang, Jess Manzano, Kendra Rimbach, Nikki Sommer, Sergei Vorobev, Shirong Wu, Soham Govande, Souki Mansoor, Tifa Chen, Tomer Kaftan, Tyce Walters, Varun Shetty
Ledarskap
Bill Peebles
Sora
Connor Holmes
Systems
Rohan Sahai
Product
Thomas Dimson
Product
Natalie Summers
Chief of Staff
Aditya Ramesh
Organization
Ett särskilt tackAdam Majmudar, Adele Li, Alexey Ivanov, Aravind Suresh, Arun Vijayvergiya, Ashkay Pall, Ben Leimberger, Brad Lightcap, Charlotte Cole, Chris Hallacy, Chris Koch, Christine McLeavey, Christopher Lehane, Dane Stuckey, Ed Bayes, Eric Sigler, Eric Wallace, Fidji Simo, Gabriel Goh, Gary Briggs, Geoff Salmon, Giancarlo Lionetti, Greg Brockman, Hannah Wong, Ian Sohl, Jakub Pachocki, Jamie Kiros, Jason Kwon, Jeffrey Han, Joanne Jang, Johannes Heidecke, Josh Achiam, Kate Rouch, Kevin Weil, Lauren Itow, Li Jing, Mark Chen, Mark Gewurz, Matt Knight, Matthew Isono, Max Burkhardt, Mayank Gupta, Mia Glaese, Michelle Fradin, Nick Turley, Patrick Geonetta, Peter Welinder, Philip Bogdanov, Prafulla Dhariwal, Robert Xiong, Ryan O'Rourke, Sam Altman, Sarah Friar, Sarah Russell, Sarah Warkov, Spencer Kim, Spencer Papay, Srinivas Narayanan, Sulman Choudhry, Szymon Sidor, Tejal Patwardhan, Vikki Lampton, Vlad Fomenko, Wojciech Zaremba, Yihong Song, Young Cha, Yuchen Zhang
Säkerhet, integritet, produktpolicy, i2, användaroperationerAdam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, Claudia Fischer, Garrett Harkins, Gilman Tolle, Jackie Hehir, Jake Brill, Jesika Haria, Kate Birks, Kelly Stirman, Lauren Jonas, Mentong Zhang, Pedram Keyani, Pedro Aguilar, Ryan Rinaldi, Sam Toizer, Sarah Ryan, Savannah Heon, Shalli Jain, Shauna O'Brien, Tim Boll, Zoe Stoll
JuridikTyce Walters, Ali Buttars, Brian McKnight, Gideon Myles, Tom Rubin, Dani Westbrook, Charles Proctor
KommunikationAlex Baker-Whitcomb, Anna McKean, Ashley Tyra, Bailey Richardson, Gaby Raila, Julie Steele, Leah Anise, Niko Felix
Marknadsföring, design och kreativ produktionAdam Brandon, Adrian Gunadi, Alexandr Khomyakov, Anne Oburgh, Antonia Richmond, Ben King, Cary Hudson, Chloe Bowers, Chris Hutchinson, Ciaran Rogers, Dalhae Lee, Dana Palmie, Daniel Stuhlpfarrer, Daniel Zhang, Elisha Greenwell Dargan, Ian Silber, Indgila Sama Ali, Jeffrey Sabin-Matsumoto, Josh Cleveland, Kaitlin Giannetti, Kenneth Kuh, Kim Baschet, Malisa Kuch, Melia Tandiono, Michaela McCrink, Minnia Feng, Nick Ciffone, Paymon Parsia, Phillip Kim, Phillip Kim, Raegan Allsbrook, Roy Chen, Shannon Jager, Thomas Degry, Xingle Huang, Yara Khakbaz, Zach Stubenvoll
Globala frågorClaudia Fischer
Debbie Mesloh
Strategisk finansChengpeng Mou
Caroline Zhao
APIAdam Wells, Alina Wu, Amelia Liu, Andi Liu, Ankit Gohel, Annie Cheng, Artyi Xu, Brian Ratajczak, Chad Nelson, Erika Kettleson, Filippo Raso, Gilman Tolle, Jackie Hehir, Jeff Harris, Jen Robinson, Joanne Shin, Jon Okun, Katia Gil Guzman, Kelly Stirman, Leher Pathak, Manoli Liodakis, Miqdad Jaffer, Olivia Morgan, Robin Koenig, Rohan Sahai, Ruth Costigan, Sarah Ryan, Savannah Heon, Shaokyi Amdo, Shaili Jain, Tabarak Khan, Tonia Osadebe, Tyce Walters, Wei Sun, Wendy Jiao, Woo Kim, Yi Ma
Konstruerad av OpenAI i San Francisco, Kalifornien
Publicerad 30 september MMXXV

Författare

Sora-teamet