Od 26 kwietnia 2026 produkt Sora nie jest już dostępny.
Dziś wprowadzamy Sora 2, nasz flagowy model do generowania materiałów wideo i audio.
Oryginalny model Sora z lutego 2024 roku był pod wieloma względami odpowiednikiem GPT‑1 do generowania wideo – po raz pierwszy generowanie wideo zaczęło działać poprawnie, a proste zachowania, takie jak trwałość obiektów, były możliwe do zrealizowania dzięki zwiększeniu mocy w fazie wstępnego trenowania. Od tego czasu zespół Sora skupia się na trenowaniu modeli z bardziej zaawansowanymi możliwościami symulowania świata. Wierzymy, że takie systemy będą miały kluczowe znaczenie dla trenowania modeli AI, które dogłębnie rozumieją fizykę naszego świata. Ważnym osiągnięciem w tej kwestii jest opanowanie szkolenia wstępnego i uzupełniającego na olbrzymich zasobach danych wideo, jednak te działania są jeszcze na bardzo wczesnym etapie rozwoju w porównaniu do zadań związanych z tworzeniem tekstów.
Prompt: figure skater performs a triple axle with a cat on her head
Dzięki Sora 2 przechodzimy bezpośrednio do tego etapu do punktu, który może być odpowiednikiem pojawienia się modelu GPT‑3.5 dla świata wideo. Sora 2 potrafi wykonywać wyjątkowo trudne zadania, a w niekiedy nawet operacje uznawane wręcz za niemożliwe dla wcześniejszych modeli generowania wideo: potrafi obrazować układy gimnastyki olimpijskiej, salta w tył na desce paddleboardowej, które dokładnie odwzorowują dynamikę wyporności i sztywności, oraz potrójne axele, podczas których kot trzyma się kurczowo, jakby od tego zależało jego życie.
Prompt: a guy does a backflip
Wcześniejsze modele wideo były nadmiernie optymistyczne – zniekształcały obiekty i odrealniały rzeczywistość, aby pomyślnie wykonać zadane polecenia tekstowe. Przykładowo: jeśli koszykarz nie trafił do kosza, piłka mogła spontanicznie teleportować się do środka obręczy. W przypadku Sora 2, jeśli koszykarz nie trafi, piłka odbije się od tablicy. Co ciekawe, „pomyłki”, które model często popełnia, wydają się być pomyłkami wewnętrznego agenta, którego Sora 2 w ten sposób modeluje, i choć nadal nie jest to model działający idealnie, znacznie dokładniej przestrzega on praw fizyki w porównaniu do wcześniejszych systemów. Niezwykle ważną zdolnością każdego użytecznego symulatora świata jest umiejętność modelowania niepowodzeń, a nie tylko sukcesów.
Model ten jest również znacznie lepszy w zakresie kontroli i potrafi wykonywać złożone, wieloetapowe instrukcje przy jednoczesnym dokładnym zachowaniu stanu świata. Znakomicie radzi sobie też ze stylem realistycznym, kinowym i anime.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Jako system do generowania materiałów audio-wideo do zastosowań ogólnych Sora 2 jest w stanie tworzyć złożone tła dźwiękowe, mowę i efekty dźwiękowe cechujące się wysokim poziomem realizmu.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Użytkownik może także bezpośrednio wprowadzać elementy świata rzeczywistego do filmów w Sora 2. Na przykład obserwując wideo jednego z naszych współpracowników, model może umieścić tę osobę w dowolnym środowisku wygenerowanym przez Sora, wiernie oddając jej wygląd i głos. Funkcja ta jest niezwykle uniwersalna i działa w przypadku każdego człowieka, zwierzęcia lub obiektu.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Modelowi nadal daleko od doskonałości i popełnia on wiele błędów, jednak utwierdza nas w przekonaniu, że dalsza rozbudowa sieci neuronowych w oparciu o dane wideo przybliży nas do opracowania systemów pozwalających na symulowanie rzeczywistości.
Zmierzając w stronę stworzenia uniwersalnych symulacji i systemów AI, które mogą działać w fizycznym świecie, wierzymy, że nasze modele dostarczą użytkownikom wiele radości.
Funkcję „prześlij siebie” zaczęliśmy testować kilka miesięcy temu w zespole Sora i wszyscy świetnie się przy tym bawiliśmy. Uznaliśmy, że to naturalna ewolucja komunikacji – od wiadomości tekstowych, przez emoji, notatki głosowe, aż powstało „to”.
Dlatego dzisiaj wprowadzamy nową społecznościową aplikację na iOS o nazwie „Sora”, opartą na Sora 2. Można w niej tworzyć i modyfikować wygenerowane treści, odkrywać nowe wideo w spersonalizowanym kanale Sora oraz wprowadzać siebie lub znajomych za pomocą funkcji „postacie”. Postacie pozwalają umieścić siebie w dowolnej scenie Sora. Aby uzyskać niezwykłą wiernością odwzorowania postaci wystarczy zarejestrować krótkie, jednorazowe nagranie „audio-wideo” w aplikacji, zweryfikować swoją tożsamość i uchwycić swój wizerunek.
W zeszłym tygodniu uruchomiliśmy aplikację wewnętrznie w OpenAI. Już dotarły do nas pierwsze informacje, że dzięki tej funkcji zawiązują się nowe przyjaźnie w firmie. Uważamy, że aplikacja społecznościowa stworzona w oparciu o funkcję „postaci” to najlepszy sposób na zapoznanie się z magią modelu Sora 2.
Obawy związane z doomscrollingiem, uzależnieniem, izolacją oraz algorytmizacjami kanałów treści są niezwykle istotne i poniżej opisujemy działania, któe podejmiemy w celu ich neutralizacji.
Dajemy użytkownikom narzędzia i możliwość kontrolowania treści oglądanych na kanale. Korzystając z istniejących dużych modeli językowych OpenAI, opracowaliśmy nową klasę algorytmów rekomendacyjnych, które można instruować w języku naturalnym. Dysponujemy również wbudowanymi mechanizmami, które pozwalają okresowo pytać użytkowników o ich samopoczucie, oraz zapewniamy opcję aktywnego dostosowania treści na kanale.
Domyślnie pokazujemy treści mocno związane z osobami, które użytkownik śledzi lub z którymi wchodzi w interakcję, a priorytet mają materiały wideo, które model uznaje za najbardziej inspirujące pod kątem kreatywności użytkownika. Nie optymalizujemy algorytmów pod kątem czasu spędzanego na kanale, a aplikację celowo zaprojektowaliśmy tak, aby priorytetyzowała tworzenie, a nie konsumpcję. Więcej informacji przedstawiamy w naszej Filozofii kanału
Aplikacja ta została stworzona z myślą o korzystaniu wspólnie ze znajomymi. Przytłaczająca większość opinii od testerów wskazuje, że to właśnie postacie sprawiają, iż korzystanie z tego rozwiązania jest inne i zabawne, jednak aby naprawdę to poczuć, trzeba spróbować samodzielnie. Jest to nowy i unikalny sposób komunikacji z ludźmi. Aplikacja będzie wymagała zaproszenia, co gwarantuje, że użytkownicy dołączają do niej wraz ze swoimi znajomymi. W czasach, gdy wszystkie główne platformy odchodzą od grafu społecznościowego, uważamy, że postacie wzmocnią poczucie wspólnoty.
Ochrona nastolatków jest dla nas ważna. Wprowadzamy domyślne ograniczenia w zakresie liczby wygenerowanych treści, jakie nastolatki mogą zobaczyć dziennie na kanale treści, a także wprowadzamy bardziej rygorystyczne uprawnienia w zakresie korzystania z postaci dla tej grupy wiekowej. Oprócz naszych zautomatyzowanych systemów bezpieczeństwa powiększamy też zespoły moderatorów, którzy w razie potrzeby mogą szybko weryfikować przypadki nękania. Wraz z Sora wprowadzamy kontrolę rodzicielską za pośrednictwem ChatGPT, aby rodzice mogli zmieniać limity nieskończonego przewijania, wyłączać personalizację algorytmiczną, a także zarządzać ustawieniami wiadomości bezpośrednich.
Dzięki postaciom masz pełną kontrolę nad swoim wizerunkiem na każdym etapie korzystania z Sora. Samodzielnie decydujesz, kto może wykorzystać utworzoną przez Ciebie postać, i możesz w każdej chwili wycofać udzieloną wcześniej zgodę lub usunąć dowolny materiał wideo, który ją zawiera. Wideo zawierające Twoją postać, włączając w to wersje robocze utworzone przez inne osoby, możemy przeglądać w dowolnym momencie.
W tej aplikacji poruszyliśmy wiele tematów związanych z bezpieczeństwem – m.in. zgodę na wykorzystanie wizerunku, pochodzenie treści, uniemożliwianie generowania krzywdzących treści itp. Więcej informacji przekazujemy w dokumencie Bezpieczeństwo w Sora 2.
Wiele problemów z innymi aplikacjami wynika z modelu monetyzacji, który nagradza decyzje sprzeczne z dobrem użytkowników. Mówiąc otwarcie: nasz jedyny obecny plan zakłada, że w przyszłości damy użytkownikom możliwość zapłacenia pewnej kwoty za wygenerowanie dodatkowego filmu, jeśli zapotrzebowanie będzie zbyt duże w stosunku do dostępnej mocy obliczeniowej. W miarę rozwoju aplikacji będziemy jasno informować o wszelkich zmianach w naszym podejściu do tej kwestii, nadal na pierwszym miejscu stawiając dobro użytkowników.
Dopiero rozpoczynamy tę podróż, ale szerokie możliwości tworzenia i remiksowania treści za pomocą Sora 2 pokazują nam, że jest to początek zupełnie nowej ery doświadczeń opartych na wspólnym tworzeniu. Mamy nadzieję, że opracowana przez nas platforma rozrywkowo-kreatywna będzie zdrowsza w użytkowaniu niż inne obecnie dostępne rozwiązania. Bawcie się dobrze :)
Aplikacja Sora dla iOS(otwiera nowe okno) jest już dostępna do pobrania. Możesz zarejestrować się w aplikacji, a gdy Twoje konto uzyska dostęp, otrzymasz powiadomienie push. Dziś rozpoczynamy początkowe wdrażanie w Stanach Zjednoczonych i Kanadzie, a niedługo mamy zamiar rozszerzenia dostępności aplikacji na kolejne kraje. Po otrzymaniu zaproszenia uzyskasz również dostęp do Sora 2 za pośrednictwem strony sora.com(otwiera nowe okno). Model Sora 2 będzie początkowo dostępny bezpłatnie, z wysokimi limitami na start, aby użytkownicy mogli swobodnie poznawać jego możliwości, choć limity te nadal będą podlegać ograniczeniom z powodów technicznych. Użytkownicy ChatGPT Pro będą mogli korzystać z naszego eksperymentalnego modelu zapewniającego wyższą jakość generowanych materiałów Sora 2 Pro na stronie sora.com(otwiera nowe okno) (a wkrótce także w aplikacji Sora). Planujemy również udostępnić Sora 2 poprzez API. Model Sora 1 Turbo będzie nadal dostępny, a wszystkie filmy utworzone za jego pomocą będą przechowywane w Twojej bibliotece na stronie sora.com(otwiera nowe okno).
Jakość filmów tworzonych przez modele wideo błyskawicznie rośnie. Uniwersalne symulatory świata oraz agenty robotyczne w zasadniczy sposób przekształcą społeczeństwo i przyspieszą rozwój ludzkości. Sora 2 to znaczący krok w kierunku realizacji tego celu. Mając na uwadze misję OpenAI, musimy dbać o to, by ludzkość odnosiła korzyści z korzystania z tych rozwijanych nieustannie modeli. Sądzimy, że Sora zapewni użytkownikom wiele radości, pobudzi kreatywność i ułatwi łączność ze światem.
Zespół Sora
Główny cel i styl graficzny
Pierwsze wrażenie: smok lecący obok ząbkowanych lodowych iglic, wiry przy końcówkach skrzydeł unoszą śnieżną mgiełkę; drugie wrażenie: spękana tafla lodowca opada ku kobaltowemu fiordowi, a bursztynowa krawędź słońca muska szron na łuskach smoka; na pysku smoka maluje się drapieżny spokój i niewymuszona potęga.
Format i wygląd
5,0 s; 4K; migawka 180°; wielkoformatowa emulacja cyfrowego sensora z wyraźnym mikrokontrastem; bardzo drobne ziarno; umiarkowany efekt halo na błyskach światła odbijających się od śniegu; brak przesunięć klatki.
Obiektywy i filtracja
ujęcie główne: obiektyw sferyczny 50 mm na zamontowanej na przodzie, żyroskopowo stabilizowanej platformie powietrznej (równoległe śledzenie z lekkim łukiem do wewnątrz). Filtracja: Black Pro-Mist 1/8; filtr polaryzacyjny kołowy o niskiej wartości w celu stłumienia odblasków na śniegu, przy jednoczesnym zachowaniu ostrych punktów świetlnych.
Korekcja barw / paleta
światła: czysta biel lodu z chłodnym przejściem tonalnym; średnie tony: stalowoniebieski lodowiec i blade, cyjanowe powietrze; cienie: łupkowe/turkusowe z zachowanymi detalami szczelin w lodzie; ciepła bursztynowa obwódka na konturach smoka dla zapewnienia separacji; skupione refleksy zwierciadlane na szronie/łuskach.
Oświetlenie i atmosfera
późnopopołudniowe nisko wiszące słońce jako oświetlenie krzyżowe; wiatr katabatyczny unoszący śnieżną mgiełkę; cienka lodowa mgiełka nadaje głębię; przerywane wybuchy lodowego pyłu w śladzie; z pyska smoka wydobywa się delikatna para oddechu.
Lokalizacja i kadrowanie
wznoszące się pole seraków oraz grzbiet ostry niczym nóż; kamera śledzi smoka z tą samą prędkością podczas przelotu na średniej wysokości, przekątne lodowca prowadzą w stronę fiordu; lodowe wypustki na pierwszym planie przechodzą blisko, dając efekt paralaksy; brak budowli wzniesionych przez człowieka.
Uwagi dotyczące garderoby/rekwizytów/pojazdów
nie dotyczy (stworzenie). Wygląd powierzchni: matowe grzbiety rogowe, półopalizujące płytki łusek z mikroszronem wzdłuż przednich krawędzi.
Dźwięk
szum wiatru na dużej wysokości, uderzenie błony skrzydła przy każdym ruchu skrzydła w dół, krystaliczne stukanie/trzeszczenie lodu dochodzące z seraków, odległy huk odłamującego się lodowca; krótki wydech/pomruk smoka: „rrhh—” (krócej niż 1 s). Brak ścieżki dźwiękowej — tylko dźwięki ze świata przedstawionego.
Zoptymalizowana lista ujęć (1 ujęcie / 5,0 s)
0,0–5,0 — „Rzeźbione równoległe grzbiety” (50 mm, ujęcie lotnicze z dziobu, z lekkim łukiem do wewnątrz i mikroprzybliżeniem)
Lecimy równo ze smokiem, gdy przemyka przez korytarz lodowych iglic; wiry przy końcówkach skrzydeł rozrywają śnieżną mgiełkę na wstęgi; odłamujący się fragment lodu spada daleko w dole, wzbijając pióropusz pyłu; kamera płynnie się zbliża – łuski stają się czytelne, bursztynowe światło krawędziowe rozbłyska – po czym smok przechyla się w stronę fiordu, tnie ogonem i rzuca na lodowiec szeroki, omiatający cień.
Cel: pokazać mityczną skalę z namacalnym realizmem w jednym zdecydowanym ujęciu – szybkość, masa i chłód żywiołu.
Uwagi dotyczące kamery (dlaczego kadr jest przekonujący)
Obiektyw 50 mm równoważy obecność stworzenia i skalę krajobrazu bez efektu miniaturyzacji; równoległe śledzenie + łuk do wewnątrz oddają prędkość i bryłę; subtelne mikroprzybliżenie zsynchronizowane z najmocniejszym uderzeniem skrzydła w dół podkreśla siłę; lekko ustawiony filtr polaryzacyjny kontroluje odblaski, jednocześnie zachowując iskrzenie; tylne/kontrowe światło słoneczne rzeźbi sylwetkę; blisko mijane lodowe wypustki zapewniają paralaksowe poczucie prędkości.
Finalizacja
Bardzo drobne ziarno (~15%); minimalny efekt halo na śnieżnych refleksach; delikatna emulacja kopii filmowej, aby zachować wiarygodne błękity i głębokie czernie; wielopasmowa dynamika, która pozwala zachować łomot skrzydeł bez maskowania huku odrywającego się lodowca; kadr plakatowy: smok przechylony w locie nad nasłonecznionym serakiem, smugi nawiewanego śniegu za nim, a w oddali fiord w kolorze głębokiego błękitu.
Sora 2
Debbie Mesloh
Caroline Zhao
Opublikowano 30 września 2025 r.


