Przejdź do treści głównej
OpenAI

30 września 2025

BadaniaWersjaProdukt

Premiera modelu Sora 2

Nasz najnowszy model do generowania wideo dokładniej odwzorowuje fizykę, jest bardziej realistyczny i daj większe możliwości kontroli niż poprzednie systemy. Zapewnia też zsynchronizowane dialogi i efekty dźwiękowe. Twórz za pomocą nowej aplikacji Sora.

Ładowanie…

Od 26 kwietnia 2026 produkt Sora nie jest już dostępny.


Dziś wprowadzamy Sora 2, nasz flagowy model do generowania materiałów wideo i audio.

Oryginalny model Sora z lutego 2024 roku był pod wieloma względami odpowiednikiem GPT‑1 do generowania wideo – po raz pierwszy generowanie wideo zaczęło działać poprawnie, a proste zachowania, takie jak trwałość obiektów, były możliwe do zrealizowania dzięki zwiększeniu mocy w fazie wstępnego trenowania. Od tego czasu zespół Sora skupia się na trenowaniu modeli z bardziej zaawansowanymi możliwościami symulowania świata. Wierzymy, że takie systemy będą miały kluczowe znaczenie dla trenowania modeli AI, które dogłębnie rozumieją fizykę naszego świata. Ważnym osiągnięciem w tej kwestii jest opanowanie szkolenia wstępnego i uzupełniającego na olbrzymich zasobach danych wideo, jednak te działania są jeszcze na bardzo wczesnym etapie rozwoju w porównaniu do zadań związanych z tworzeniem tekstów.

Prompt: figure skater performs a triple axle with a cat on her head

Dzięki Sora 2 przechodzimy bezpośrednio do tego etapu do punktu, który może być odpowiednikiem pojawienia się modelu GPT‑3.5 dla świata wideo. Sora 2 potrafi wykonywać wyjątkowo trudne zadania, a w niekiedy nawet operacje uznawane wręcz za niemożliwe dla wcześniejszych modeli generowania wideo: potrafi obrazować układy gimnastyki olimpijskiej, salta w tył na desce paddleboardowej, które dokładnie odwzorowują dynamikę wyporności i sztywności, oraz potrójne axele, podczas których kot trzyma się kurczowo, jakby od tego zależało jego życie.

Prompt: a guy does a backflip

Wcześniejsze modele wideo były nadmiernie optymistyczne – zniekształcały obiekty i odrealniały rzeczywistość, aby pomyślnie wykonać zadane polecenia tekstowe. Przykładowo: jeśli koszykarz nie trafił do kosza, piłka mogła spontanicznie teleportować się do środka obręczy. W przypadku Sora 2, jeśli koszykarz nie trafi, piłka odbije się od tablicy. Co ciekawe, „pomyłki”, które model często popełnia, wydają się być pomyłkami wewnętrznego agenta, którego Sora 2 w ten sposób modeluje, i choć nadal nie jest to model działający idealnie, znacznie dokładniej przestrzega on praw fizyki w porównaniu do wcześniejszych systemów. Niezwykle ważną zdolnością każdego użytecznego symulatora świata jest umiejętność modelowania niepowodzeń, a nie tylko sukcesów.

Model ten jest również znacznie lepszy w zakresie kontroli i potrafi wykonywać złożone, wieloetapowe instrukcje przy jednoczesnym dokładnym zachowaniu stanu świata. Znakomicie radzi sobie też ze stylem realistycznym, kinowym i anime.

Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...

Jako system do generowania materiałów audio-wideo do zastosowań ogólnych Sora 2 jest w stanie tworzyć złożone tła dźwiękowe, mowę i efekty dźwiękowe cechujące się wysokim poziomem realizmu.

Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time

Użytkownik może także bezpośrednio wprowadzać elementy świata rzeczywistego do filmów w Sora 2. Na przykład obserwując wideo jednego z naszych współpracowników, model może umieścić tę osobę w dowolnym środowisku wygenerowanym przez Sora, wiernie oddając jej wygląd i głos. Funkcja ta jest niezwykle uniwersalna i działa w przypadku każdego człowieka, zwierzęcia lub obiektu.

Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much

Modelowi nadal daleko od doskonałości i popełnia on wiele błędów, jednak utwierdza nas w przekonaniu, że dalsza rozbudowa sieci neuronowych w oparciu o dane wideo przybliży nas do opracowania systemów pozwalających na symulowanie rzeczywistości.

Wdrażanie Sora 2

Zmierzając w stronę stworzenia uniwersalnych symulacji i systemów AI, które mogą działać w fizycznym świecie, wierzymy, że nasze modele dostarczą użytkownikom wiele radości.

Funkcję „prześlij siebie” zaczęliśmy testować kilka miesięcy temu w zespole Sora i wszyscy świetnie się przy tym bawiliśmy. Uznaliśmy, że to naturalna ewolucja komunikacji – od wiadomości tekstowych, przez emoji, notatki głosowe, aż powstało „to”.

Dlatego dzisiaj wprowadzamy nową społecznościową aplikację na iOS o nazwie „Sora”, opartą na Sora 2. Można w niej tworzyć i modyfikować wygenerowane treści, odkrywać nowe wideo w spersonalizowanym kanale Sora oraz wprowadzać siebie lub znajomych za pomocą funkcji „postacie”. Postacie pozwalają umieścić siebie w dowolnej scenie Sora. Aby uzyskać niezwykłą wiernością odwzorowania postaci wystarczy zarejestrować krótkie, jednorazowe nagranie „audio-wideo” w aplikacji, zweryfikować swoją tożsamość i uchwycić swój wizerunek.

W zeszłym tygodniu uruchomiliśmy aplikację wewnętrznie w OpenAI. Już dotarły do nas pierwsze informacje, że dzięki tej funkcji zawiązują się nowe przyjaźnie w firmie. Uważamy, że aplikacja społecznościowa stworzona w oparciu o funkcję „postaci” to najlepszy sposób na zapoznanie się z magią modelu Sora 2.

Premiera w sposób odpowiedzialny

Obawy związane z doomscrollingiem, uzależnieniem, izolacją oraz algorytmizacjami kanałów treści są niezwykle istotne i poniżej opisujemy działania, któe podejmiemy w celu ich neutralizacji.

Dajemy użytkownikom narzędzia i możliwość kontrolowania treści oglądanych na kanale. Korzystając z istniejących dużych modeli językowych OpenAI, opracowaliśmy nową klasę algorytmów rekomendacyjnych, które można instruować w języku naturalnym. Dysponujemy również wbudowanymi mechanizmami, które pozwalają okresowo pytać użytkowników o ich samopoczucie, oraz zapewniamy opcję aktywnego dostosowania treści na kanale.

Domyślnie pokazujemy treści mocno związane z osobami, które użytkownik śledzi lub z którymi wchodzi w interakcję, a priorytet mają materiały wideo, które model uznaje za najbardziej inspirujące pod kątem kreatywności użytkownika. Nie optymalizujemy algorytmów pod kątem czasu spędzanego na kanale, a aplikację celowo zaprojektowaliśmy tak, aby priorytetyzowała tworzenie, a nie konsumpcję. Więcej informacji przedstawiamy w naszej Filozofii kanału

Aplikacja ta została stworzona z myślą o korzystaniu wspólnie ze znajomymi. Przytłaczająca większość opinii od testerów wskazuje, że to właśnie postacie sprawiają, iż korzystanie z tego rozwiązania jest inne i zabawne, jednak aby naprawdę to poczuć, trzeba spróbować samodzielnie. Jest to nowy i unikalny sposób komunikacji z ludźmi. Aplikacja będzie wymagała zaproszenia, co gwarantuje, że użytkownicy dołączają do niej wraz ze swoimi znajomymi. W czasach, gdy wszystkie główne platformy odchodzą od grafu społecznościowego, uważamy, że postacie wzmocnią poczucie wspólnoty.

Ochrona nastolatków jest dla nas ważna. Wprowadzamy domyślne ograniczenia w zakresie liczby wygenerowanych treści, jakie nastolatki mogą zobaczyć dziennie na kanale treści, a także wprowadzamy bardziej rygorystyczne uprawnienia w zakresie korzystania z postaci dla tej grupy wiekowej. Oprócz naszych zautomatyzowanych systemów bezpieczeństwa powiększamy też zespoły moderatorów, którzy w razie potrzeby mogą szybko weryfikować przypadki nękania. Wraz z Sora wprowadzamy kontrolę rodzicielską za pośrednictwem ChatGPT, aby rodzice mogli zmieniać limity nieskończonego przewijania, wyłączać personalizację algorytmiczną, a także zarządzać ustawieniami wiadomości bezpośrednich.

Dzięki postaciom masz pełną kontrolę nad swoim wizerunkiem na każdym etapie korzystania z Sora. Samodzielnie decydujesz, kto może wykorzystać utworzoną przez Ciebie postać, i możesz w każdej chwili wycofać udzieloną wcześniej zgodę lub usunąć dowolny materiał wideo, który ją zawiera. Wideo zawierające Twoją postać, włączając w to wersje robocze utworzone przez inne osoby, możemy przeglądać w dowolnym momencie.

W tej aplikacji poruszyliśmy wiele tematów związanych z bezpieczeństwem – m.in. zgodę na wykorzystanie wizerunku, pochodzenie treści, uniemożliwianie generowania krzywdzących treści itp. Więcej informacji przekazujemy w dokumencie Bezpieczeństwo w Sora 2.

Wiele problemów z innymi aplikacjami wynika z modelu monetyzacji, który nagradza decyzje sprzeczne z dobrem użytkowników. Mówiąc otwarcie: nasz jedyny obecny plan zakłada, że w przyszłości damy użytkownikom możliwość zapłacenia pewnej kwoty za wygenerowanie dodatkowego filmu, jeśli zapotrzebowanie będzie zbyt duże w stosunku do dostępnej mocy obliczeniowej. W miarę rozwoju aplikacji będziemy jasno informować o wszelkich zmianach w naszym podejściu do tej kwestii, nadal na pierwszym miejscu stawiając dobro użytkowników.

Dopiero rozpoczynamy tę podróż, ale szerokie możliwości tworzenia i remiksowania treści za pomocą Sora 2 pokazują nam, że jest to początek zupełnie nowej ery doświadczeń opartych na wspólnym tworzeniu. Mamy nadzieję, że opracowana przez nas platforma rozrywkowo-kreatywna będzie zdrowsza w użytkowaniu niż inne obecnie dostępne rozwiązania. Bawcie się dobrze :)

Dostępność Sora 2 i przyszłość platformy

Aplikacja Sora dla iOS(otwiera nowe okno) jest już dostępna do pobrania. Możesz zarejestrować się w aplikacji, a gdy Twoje konto uzyska dostęp, otrzymasz powiadomienie push. Dziś rozpoczynamy początkowe wdrażanie w Stanach Zjednoczonych i Kanadzie, a niedługo mamy zamiar rozszerzenia dostępności aplikacji na kolejne kraje. Po otrzymaniu zaproszenia uzyskasz również dostęp do Sora 2 za pośrednictwem strony sora.com(otwiera nowe okno). Model Sora 2 będzie początkowo dostępny bezpłatnie, z wysokimi limitami na start, aby użytkownicy mogli swobodnie poznawać jego możliwości, choć limity te nadal będą podlegać ograniczeniom z powodów technicznych. Użytkownicy ChatGPT Pro będą mogli korzystać z naszego eksperymentalnego modelu zapewniającego wyższą jakość generowanych materiałów Sora 2 Pro na stronie sora.com(otwiera nowe okno) (a wkrótce także w aplikacji Sora). Planujemy również udostępnić Sora 2 poprzez API. Model Sora 1 Turbo będzie nadal dostępny, a wszystkie filmy utworzone za jego pomocą będą przechowywane w Twojej bibliotece na stronie sora.com(otwiera nowe okno).

Jakość filmów tworzonych przez modele wideo błyskawicznie rośnie. Uniwersalne symulatory świata oraz agenty robotyczne w zasadniczy sposób przekształcą społeczeństwo i przyspieszą rozwój ludzkości. Sora 2 to znaczący krok w kierunku realizacji tego celu. Mając na uwadze misję OpenAI, musimy dbać o to, by ludzkość odnosiła korzyści z korzystania z tych rozwijanych nieustannie modeli. Sądzimy, że Sora zapewni użytkownikom wiele radości, pobudzi kreatywność i ułatwi łączność ze światem.

Zespół Sora

Główny cel i styl graficzny
Pierwsze wrażenie: smok lecący obok ząbkowanych lodowych iglic, wiry przy końcówkach skrzydeł unoszą śnieżną mgiełkę; drugie wrażenie: spękana tafla lodowca opada ku kobaltowemu fiordowi, a bursztynowa krawędź słońca muska szron na łuskach smoka; na pysku smoka maluje się drapieżny spokój i niewymuszona potęga.

Format i wygląd
5,0 s; 4K; migawka 180°; wielkoformatowa emulacja cyfrowego sensora z wyraźnym mikrokontrastem; bardzo drobne ziarno; umiarkowany efekt halo na błyskach światła odbijających się od śniegu; brak przesunięć klatki.

Obiektywy i filtracja
ujęcie główne: obiektyw sferyczny 50 mm na zamontowanej na przodzie, żyroskopowo stabilizowanej platformie powietrznej (równoległe śledzenie z lekkim łukiem do wewnątrz). Filtracja: Black Pro-Mist 1/8; filtr polaryzacyjny kołowy o niskiej wartości w celu stłumienia odblasków na śniegu, przy jednoczesnym zachowaniu ostrych punktów świetlnych.

Korekcja barw / paleta
światła: czysta biel lodu z chłodnym przejściem tonalnym; średnie tony: stalowoniebieski lodowiec i blade, cyjanowe powietrze; cienie: łupkowe/turkusowe z zachowanymi detalami szczelin w lodzie; ciepła bursztynowa obwódka na konturach smoka dla zapewnienia separacji; skupione refleksy zwierciadlane na szronie/łuskach.

Oświetlenie i atmosfera
późnopopołudniowe nisko wiszące słońce jako oświetlenie krzyżowe; wiatr katabatyczny unoszący śnieżną mgiełkę; cienka lodowa mgiełka nadaje głębię; przerywane wybuchy lodowego pyłu w śladzie; z pyska smoka wydobywa się delikatna para oddechu.

Lokalizacja i kadrowanie
wznoszące się pole seraków oraz grzbiet ostry niczym nóż; kamera śledzi smoka z tą samą prędkością podczas przelotu na średniej wysokości, przekątne lodowca prowadzą w stronę fiordu; lodowe wypustki na pierwszym planie przechodzą blisko, dając efekt paralaksy; brak budowli wzniesionych przez człowieka.

Uwagi dotyczące garderoby/rekwizytów/pojazdów
nie dotyczy (stworzenie). Wygląd powierzchni: matowe grzbiety rogowe, półopalizujące płytki łusek z mikroszronem wzdłuż przednich krawędzi.

Dźwięk
szum wiatru na dużej wysokości, uderzenie błony skrzydła przy każdym ruchu skrzydła w dół, krystaliczne stukanie/trzeszczenie lodu dochodzące z seraków, odległy huk odłamującego się lodowca; krótki wydech/pomruk smoka: „rrhh—” (krócej niż 1 s). Brak ścieżki dźwiękowej — tylko dźwięki ze świata przedstawionego.

Zoptymalizowana lista ujęć (1 ujęcie / 5,0 s)
0,0–5,0 — „Rzeźbione równoległe grzbiety” (50 mm, ujęcie lotnicze z dziobu, z lekkim łukiem do wewnątrz i mikroprzybliżeniem)
Lecimy równo ze smokiem, gdy przemyka przez korytarz lodowych iglic; wiry przy końcówkach skrzydeł rozrywają śnieżną mgiełkę na wstęgi; odłamujący się fragment lodu spada daleko w dole, wzbijając pióropusz pyłu; kamera płynnie się zbliża – łuski stają się czytelne, bursztynowe światło krawędziowe rozbłyska – po czym smok przechyla się w stronę fiordu, tnie ogonem i rzuca na lodowiec szeroki, omiatający cień.
Cel: pokazać mityczną skalę z namacalnym realizmem w jednym zdecydowanym ujęciu – szybkość, masa i chłód żywiołu.

Uwagi dotyczące kamery (dlaczego kadr jest przekonujący)
Obiektyw 50 mm równoważy obecność stworzenia i skalę krajobrazu bez efektu miniaturyzacji; równoległe śledzenie + łuk do wewnątrz oddają prędkość i bryłę; subtelne mikroprzybliżenie zsynchronizowane z najmocniejszym uderzeniem skrzydła w dół podkreśla siłę; lekko ustawiony filtr polaryzacyjny kontroluje odblaski, jednocześnie zachowując iskrzenie; tylne/kontrowe światło słoneczne rzeźbi sylwetkę; blisko mijane lodowe wypustki zapewniają paralaksowe poczucie prędkości.

Finalizacja
Bardzo drobne ziarno (~15%); minimalny efekt halo na śnieżnych refleksach; delikatna emulacja kopii filmowej, aby zachować wiarygodne błękity i głębokie czernie; wielopasmowa dynamika, która pozwala zachować łomot skrzydeł bez maskowania huku odrywającego się lodowca; kadr plakatowy: smok przechylony w locie nad nasłonecznionym serakiem, smugi nawiewanego śniegu za nim, a w oddali fiord w kolorze głębokiego błękitu.

Sora 2

BadaniaHarold Li, Dmytro Okhonko, Avi Verma, Eric Zhang, Ricky Wang, Troy Luhman, Eric Luhman, Bram Wallace, Eric Mintun, Michael Chang, Gabriel Petersson, Jure Zbontar, Daniel Geng, Will DePue, Alex Zhao, Cheng Lu, Yufei Guo, Pritam Damania, Larry Kai, Farzad Khorasani, Kenji Hata, James Betker, Vladimir Chalyshev, Connor Holmes, Aditya Ramesh, Bill Peebles
ProduktAndrew Kondrich, Andrew Sima, Andrew Thieck, Andrey Malevich, Antonio Di Francesco, Bin Wen, Bing Liang, Boyang Niu, Cheng Su, Cristina Scheau, Daniel Latta-Lin, David Schnurr, Dhruba Borthakur, Duc Tran, Gilman Tolle, Greg Hochmuth, Joe Taylor, Joey Flynn, Joey Pereira, Julius Hochmuth, Key Shin, Liam Esparraguera, Liang Wu, Liang Xiong, Mengchao Zhong, Michelle Hwang, Mick Jermsurawong, Mike Starr, Omar Elfanek, Patrick Hum, Pavel Komlev, Rajeev Nayak, Raunak Daga, Rohan Sahai, Sergii Rudenko, Shuyi Chen, Tarek Younes, Thomas Bredillet, Thomas Dimson, Victoria Huang, Vladimir Chalyshev, Welton Wang, Wesam Manassra, Xiaolong Wang, Yizhe Yu, Yun Jiang, Zhigang Wang
WspółpracownicyAarash Heydari, Chad Nelson, Daniel Fradin, David Duxin, Hessam Bagherinezhad, Jasmyn Samaroo, Jay Wang, Jess Manzano, Kendra Rimbach, Nikki Sommer, Sergei Vorobev, Shirong Wu, Soham Govande, Souki Mansoor, Tifa Chen, Tomer Kaftan, Tyce Walters, Varun Shetty
Przywództwo
Bill Peebles
Sora
Connor Holmes
Systems
Rohan Sahai
Product
Thomas Dimson
Product
Natalie Summers
Chief of Staff
Aditya Ramesh
Organization
Podziękowania specjalneAdam Majmudar, Adele Li, Alexey Ivanov, Aravind Suresh, Arun Vijayvergiya, Ashkay Pall, Ben Leimberger, Brad Lightcap, Charlotte Cole, Chris Hallacy, Chris Koch, Christine McLeavey, Christopher Lehane, Dane Stuckey, Ed Bayes, Eric Sigler, Eric Wallace, Fidji Simo, Gabriel Goh, Gary Briggs, Geoff Salmon, Giancarlo Lionetti, Greg Brockman, Hannah Wong, Ian Sohl, Jakub Pachocki, Jamie Kiros, Jason Kwon, Jeffrey Han, Joanne Jang, Johannes Heidecke, Josh Achiam, Kate Rouch, Kevin Weil, Lauren Itow, Li Jing, Mark Chen, Mark Gewurz, Matt Knight, Matthew Isono, Max Burkhardt, Mayank Gupta, Mia Glaese, Michelle Fradin, Nick Turley, Patrick Geonetta, Peter Welinder, Philip Bogdanov, Prafulla Dhariwal, Robert Xiong, Ryan O'Rourke, Sam Altman, Sarah Friar, Sarah Russell, Sarah Warkov, Spencer Kim, Spencer Papay, Srinivas Narayanan, Sulman Choudhry, Szymon Sidor, Tejal Patwardhan, Vikki Lampton, Vlad Fomenko, Wojciech Zaremba, Yihong Song, Young Cha, Yuchen Zhang
Bezpieczeństwo, Uczciwość, Polityka Produktowa, i2, Operacje użytkownikówAdam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, Claudia Fischer, Garrett Harkins, Gilman Tolle, Jackie Hehir, Jake Brill, Jesika Haria, Kate Birks, Kelly Stirman, Lauren Jonas, Mentong Zhang, Pedram Keyani, Pedro Aguilar, Ryan Rinaldi, Sam Toizer, Sarah Ryan, Savannah Heon, Shalli Jain, Shauna O'Brien, Tim Boll, Zoe Stoll
LegalTyce Walters, Ali Buttars, Brian McKnight, Gideon Myles, Tom Rubin, Dani Westbrook, Charles Proctor
KomunikacjaAlex Baker-Whitcomb, Anna McKean, Ashley Tyra, Bailey Richardson, Gaby Raila, Julie Steele, Leah Anise, Niko Felix
Marketing, Projektowanie i TworzenieAdam Brandon, Adrian Gunadi, Alexandr Khomyakov, Anne Oburgh, Antonia Richmond, Ben King, Cary Hudson, Chloe Bowers, Chris Hutchinson, Ciaran Rogers, Dalhae Lee, Dana Palmie, Daniel Stuhlpfarrer, Daniel Zhang, Elisha Greenwell Dargan, Ian Silber, Indgila Sama Ali, Jeffrey Sabin-Matsumoto, Josh Cleveland, Kaitlin Giannetti, Kenneth Kuh, Kim Baschet, Malisa Kuch, Melia Tandiono, Michaela McCrink, Minnia Feng, Nick Ciffone, Paymon Parsia, Phillip Kim, Phillip Kim, Raegan Allsbrook, Roy Chen, Shannon Jager, Thomas Degry, Xingle Huang, Yara Khakbaz, Zach Stubenvoll
Kwestie globalneClaudia Fischer
Debbie Mesloh
Finansowanie strategiczneChengpeng Mou
Caroline Zhao
APIAdam Wells, Alina Wu, Amelia Liu, Andi Liu, Ankit Gohel, Annie Cheng, Artyi Xu, Brian Ratajczak, Chad Nelson, Erika Kettleson, Filippo Raso, Gilman Tolle, Jackie Hehir, Jeff Harris, Jen Robinson, Joanne Shin, Jon Okun, Katia Gil Guzman, Kelly Stirman, Leher Pathak, Manoli Liodakis, Miqdad Jaffer, Olivia Morgan, Robin Koenig, Rohan Sahai, Ruth Costigan, Sarah Ryan, Savannah Heon, Shaokyi Amdo, Shaili Jain, Tabarak Khan, Tonia Osadebe, Tyce Walters, Wei Sun, Wendy Jiao, Woo Kim, Yi Ma
Stworzone przez OpenAI w San Francisco w stanie Kalifornia
Opublikowano 30 września 2025 r.

Autor

Zespół Sora