Sora 2 je tu
Náš najnovší model generácie videa je fyzicky presnejší, realistickejší a lepšie ovládateľný ako predchádzajúce systémy. Obsahuje tiež synchronizované dialógy a zvukové efekty. Tvorte s ním v novej aplikácii Sora.
Od 26. apríla 2026 už produkt Sora nie je dostupný.
Dnes uvádzame na trh Sora 2, náš vlajkový model na generovanie videa a zvuku.
Pôvodný model Sora z februára 2024 bol v mnohých ohľadoch momentom GPT‑1 pre video. Prvýkrát sa zdalo, že generovanie videa funguje, a jednoduché správanie, ako je stálosť objektu, sa objavilo vďaka zvýšeniu výpočtového výkonu pri predtréningovom procese. Odvtedy sa Team Sora zameriava na tréning modelov s pokročilejšími schopnosťami simulácie sveta. Veríme, že takéto systémy budú kľúčové pre tréning modelov umelej inteligencie, ktoré hlboko rozumejú fyzickému svetu. Hlavným míľnikom je zvládnutie predtréningu a posttréningu na rozsiahlych video údajoch, ktoré sú v porovnaní s jazykom ešte len v začiatkoch.
Prompt: figure skater performs a triple axle with a cat on her head
So Sora 2 sa priamo dostávame k tomu, čo si myslíme, že by mohol byť momentom GPT‑3.5 pre video. Sora 2 dokáže robiť veci, ktoré sú pre predchádzajúce modely generácie videa mimoriadne náročné – a v niektorých prípadoch úplne nemožné: olympijské gymnastické zostavy, saltá vzad na paddleboarde, ktoré presne modelujú dynamiku vztlaku a tuhosti, a trojité osi, zatiaľ čo sa mačka drží ako o život.
Prompt: a guy does a backflip
Predchádzajúce video modely sú príliš optimistické – menia objekty a deformujú realitu, aby sa úspešne spustili po zadaní textového príkazu. Napríklad, ak basketbalista netrafí kôš, lopta sa môže samovoľne teleportovať do koša. V Sora 2, ak basketbalista netrafí kôš, lopta sa odrazí od dosky. Je zaujímavé, že „chyby“, ktoré model robí, sa často javia ako chyby vnútorného agenta, ktorého Sora 2 implicitne modeluje; hoci je stále nedokonalý, v porovnaní s predchádzajúcimi systémami lepšie dodržiava zákony fyziky. Toto je mimoriadne dôležitá schopnosť pre každý užitočný simulátor sveta – musíte byť schopní modelovať zlyhanie, nielen úspech.
Model je tiež veľkým skokom vpred v ovládateľnosti, dokáže sledovať zložité pokyny zahŕňajúce viacero záberov a zároveň presne zachovať stav sveta. Vyniká v realistických, filmových a anime štýloch.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Ako univerzálny systém na generovanie videa a zvuku je schopný vytvárať sofistikované zvukové pozadia, reč a zvukové efekty s vysokou mierou realizmu.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Do Sora 2 môžete tiež priamo vkladať prvky reálneho sveta. Napríklad, sledovaním videa jedného z našich spoluhráčov ho model dokáže vložiť do akéhokoľvek prostredia vygenerovaného aplikáciou Sora s presným zobrazením vzhľadu a hlasu. Táto schopnosť je veľmi všeobecná a funguje pre akúkoľvek osobu, zviera alebo objekt.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Model nie je ani zďaleka dokonalý a robí veľa chýb, ale je to potvrdenie, že ďalšie rozširovanie neurálnych sietí na video údajoch nás priblíži k simulácii reality.
Na ceste k univerzálnym simuláciám a systémom umelej inteligencie, ktoré môžu fungovať vo fyzickom svete, si myslíme, že ľudia sa s modelmi, ktoré popri tom vytvárame, môžu veľmi zabaviť.
S touto funkciou „nahrania seba samého“ sme začali hrať už pred niekoľkými mesiacmi v tíme Sora a všetci sme si ju skvele užili. Pripadalo nám to ako prirodzený vývoj komunikácie – od textových správ cez emotikony a hlasové poznámky až po toto.
Dnes spúšťame novú sociálnu aplikáciu pre iOS s názvom „Sora“, ktorú poháňa Sora 2. V aplikácii môžeš vytvárať, remixovať generácie ostatných, objavovať nové videá v prispôsobiteľnom informačnom kanáli Sora a pridávať seba alebo svojich priateľov prostredníctvom funkcie s názvom „Osobnosti“. S Osobnosťami sa môžeš po krátkom jednorazovom nahrávaní videa a zvuku v aplikácii dostať priamo do akejkoľvek scény Sora s pozoruhodnou vernosťou na overenie tvojej totožnosti a zachytenia svojej podoby.
Minulý týždeň sme aplikáciu interne spustili pre všetkých v OpenAI. Už sme počuli od našich kolegov, že si vďaka tejto funkcii v spoločnosti nachádzajú nových priateľov. Domnievame sa, že sociálna aplikácia postavená na tejto funkcii „osobností“ je najlepším spôsobom, ako zažiť kúzlo Sora 2.
Obavy z doomscrollingu, závislosti, izolácie a RL-sloptimalizovaných kanálov sú na prvom mieste — a to s tým robíme.
Používateľom poskytujeme nástroje a možnosti, aby mali kontrolu nad tým, čo vidia v informačnom kanáli. Pomocou existujúcich veľkých jazykových modelov OpenAI sme vyvinuli novú triedu odporúčacích algoritmov, ktoré je možné inštruovať prostredníctvom prirodzeného jazyka. Máme tiež zabudované mechanizmy na pravidelné prieskumy používateľov o ich pohode a proaktívne im poskytujeme možnosť upraviť si svoj informačný kanál.
V predvolenom nastavení ti zobrazujeme obsah, ktorý je výrazne zameraný na ľudí, ktorých sleduješ alebo s ktorými komunikuješ, a uprednostňujeme videá, o ktorých si model myslí, že ich s najväčšou pravdepodobnosťou použiješ ako inšpiráciu pre svoje vlastné výtvory. Neoptimalizujeme čas strávený v kanáli a aplikáciu sme výslovne navrhli tak, aby maximalizovala tvorbu, a nie spotrebu. Viac podrobností nájdeš v našej Filozofii informačného kanála
Táto aplikácia je určená na použitie s tvojimi priateľmi. Prevažujúca spätná väzba od testerov hovorí, že osobnosti sú tým, vďaka čomu to pôsobí inak a je zábavné ju používať – musíš si to vyskúšať, aby ste to naozaj pochopil/-a, ale je to nový a jedinečný spôsob komunikácie s ľuďmi. Prinášame to v podobe aplikácie založenej na pozvánkach, aby sme sa uistili, že prídeš s priateľmi. Myslíme si, že v čase, keď sa všetky hlavné platformy odkláňajú od sociálnych grafov, osobnosti posilnia komunitu.
Ochrana bezpečnosti tínedžerov je pre nás dôležitá. Zavádzame predvolené limity na počet generácií, ktoré môžu tínedžeri denne vidieť v informačnom kanáli, a tiež zavádzame prísnejšie povolenia pre Osobnosti v tejto skupine. Okrem našich automatizovaných bezpečnostných systémov rozširujeme tímy ľudských moderátorov, aby mohli rýchlo preskúmať prípady šikanovania, ak k nim dôjde. Spolu so Sora spúšťame rodičovskú kontrolu prostredníctvom ChatGPT, aby rodičia mohli prepísať limity nekonečného posúvania, vypnúť personalizáciu algoritmov a spravovať nastavenia priamych správ.
Pri osobnostiach máš s aplikáciou Sora úplnú kontrolu nad svojou podobou od začiatku do konca. Iba ty rozhoduješ, kto môže používať tvoju osobnosť, a kedykoľvek môžeš zrušiť prístup alebo odstrániť akékoľvek video, ktoré ju obsahuje. Videá obsahujúce tvoju osobnosť vrátane návrhov vytvorených inými ľuďmi si môžeš pozrieť kedykoľvek.
V tejto aplikácii sme sa zaoberali mnohými bezpečnostnými témami – súhlas s používaním podoby, pôvodom obsahu, zabránením vytváraniu škodlivého obsahu a mnohými ďalšími. Viac informácií nájdeš v našom dokumente o bezpečnosti Sora 2.
Mnohé problémy s inými aplikáciami vyplývajú z modelu monetizácie, ktorý motivuje k rozhodnutiam, ktoré sú v rozpore s blahom používateľov. Priamočiaro povedané, naším jediným súčasným plánom je nakoniec dať používateľom možnosť zaplatiť určitú sumu za vygenerovanie dodatočného videa, ak je dopyt príliš vysoký v porovnaní s dostupnou výpočtovou kapacitou. Popri vývoji aplikácie tu budeme otvorene komunikovať všetky zmeny v našom prístupe, pričom naďalej budeme mať ako hlavný cieľ blaho používateľov.
Sme len na začiatku tejto cesty, ale vzhľadom na všetky tie výkonné spôsoby, ako vytvárať a remixovať obsah so Sora 2, to vnímame ako začiatok úplne novej éry pre spoločné kreatívne zážitky. Sme optimistickí, že toto bude zdravšia platforma pre zábavu a kreativitu v porovnaní s tým, čo je dostupné teraz. Dúfame, že sa budete dobre baviť :)
Aplikácia Sora pre iOS(otvorí sa v novom okne) je teraz k dispozícii na stiahnutie. Po otvorení prístupu k vášmu účtu sa v aplikácii môžeš zaregistrovať na odber push oznámení. Dnes začíname s počiatočným zavádzaním v Spojených štátoch a Kanade s úmyslom rýchlo sa rozšíriť do ďalších krajín. Po prijatí pozvánky budeš mať tiež prístup k Sora 2 prostredníctvom sora.com(otvorí sa v novom okne). Sora 2 bude spočiatku dostupná zadarmo, s veľkorysými počiatočnými limitmi, aby si ľudia mohli voľne preskúmať jej možnosti, hoci tie stále podliehajú výpočtovým obmedzeniam. Používatelia ChatGPT Pro budú môcť tiež používať náš experimentálny, kvalitnejší model Sora 2 Pro na sora.com(otvorí sa v novom okne) (a čoskoro aj v aplikácii Sora). Taktiež plánujeme vydať Sora 2 v API. Sora 1 Turbo zostane k dispozícii a všetko, čo ste vytvorili, bude pokračovať v tvojej knižnici na sora.com(otvorí sa v novom okne).
Video modely sa veľmi rýchlo zlepšujú. Univerzálne simulátory sveta a robotickí agenti zásadne premenia spoločnosť a urýchlia pokrok ľudstva. Sora 2 predstavuje významný pokrok smerom k tomuto cieľu. V súlade s poslaním OpenAI je dôležité, aby ľudstvo malo z týchto modelov úžitok hneď po ich vývoji. Premýšľame, že Sora prinesie svetu veľa radosti, kreativity a prepojenia.
— Napísal Team Sora
Primárny cieľ a vizuálne prvky
Prvé čítanie: drak prerezávajúci zúbkované ľadové veže, víry na koncoch krídel odlupujúce sa od ľadovcového náletu; druhé čítanie: rozlámaná pokrývka ľadovca odpadá do kobaltového fjordu s jantárovým slnečným okrajom bozkávajúcim mráz na šupinách; z výrazu sa dá vyčítať dravý pokoj/sila bez námahy.
Formát a vzhľad
5,0 s; 4K; 180° uzávierka; emulácia digitálneho snímača veľkoformátu s ostrým mikrokontrastom; veľmi jemná zrnitosť; zmiernená halácia na snehových odleskoch; žiadne prelínanie farieb.
Šošovky a filtre
Hrdina: 50 mm guľovitý tvar na gyroskopicky stabilizovanej leteckej platforme umiestnenej na nose (paralelné sledovanie s miernym oblúkom dovnútra). Filtrácia: Black Pro-Mist 1/8; kruhový polarizačný filter nastavuje svetlo na tlmenie odleskov snehu a zároveň zachovanie zrkadlového lesku.
Stupeň / Paleta
Hlavné prvky: čistá ľadovo biela s chladným prechodom; stredy: oceľovo modrý ľadovec a bledý azúrový vzduch; tiene: bridlicovo-tyrkysová so zachovanými detailmi trhliny; teplý jantárový okraj na dračích okrajoch pre oddelenie; odlesky tesne na námraze/šupinách.
Osvetlenie a atmosféra
Neskoré popoludnie nízke slnko po celej krajine; katabatický vietor zdvíhajúci snehový prach; tenký zamrznutý opar pre hĺbku; občasné výbuchy ľadového prachu v brázde; slabý dychový opar z draka pri námahe.
Umiestnenie a rámovanie
Vyvýšené serakové pole a ostrý hrebeň; kamery sledujú dráhu draka v strednej nadmorskej výške, ľadovcové diagonály sa vracajú späť k fjordu; ľadové plutvy v popredí prechádzajú blízko kvôli paralaxe; žiadne ľudské stavby.
Šatník / Rekvizity / Poznámky k vozidlu
N/A (tvor). Čítanie povrchu: matné rohové hrebene, pololesklé šupinové dosky s mikromrazou pozdĺž nábežných hrán.
Zvuk
Strih vetra vo vysokom vzduchu, dunenie krídelných membrán pri každom zdvihu, krištáľovo kryštalický ľadový zvuk zo serakov, vzdialené dunenie odlupujúceho sa ľadovca; rýchly výdych/rachot draka: „Rrrh—“ (sub-1). Žiadne skóre – čistý diegetický úžas.
Optimalizovaný zoznam záberov (1 záber / 5,0 s)
0,0–5,0 — „Parallel Ridge Carve“ (50 mm, anténa umiestnená na nose s miernym vnútorným oblúkom a mikrotlakom)
Sledujeme draka, ktorý sa prepletá chodbou ľadových veží; víry na koncoch krídel odlupujú unášané vlákna do pásikov; odlupujúci sa fragment padá hlboko pod nás a vysiela prachový oblak; kamera sa približuje – vidieť šupiny, jantárový okraj vzplanie – potom sa drak nakláňa k fjordu, chvost sa mu krúti a vrhá rozsiahly tieň na ľadovec.
Účel: Priniesť mýtický rozsah s hmatovým realizmom v jednom rozhodujúcom kroku – rýchlosť, hmotnosť a elementárny chlad.
Poznámky k fotoaparátu (prečo sa číta)
50 mm vyvažuje prítomnosť tvora a mierku krajiny bez miniaturizácie; paralelná dráha + vnútorný oblúk prepožičiava rýchlosť a tvar; mikrokrátenie času s najsilnejším ťahom nadol pre výraznú silu; polarizátor svetla kontroluje odlesky a zároveň zachováva trblietky; slnko na zadnej/okrajovej strane modeluje siluetu; ľadové plutvy poskytujú paralaxné rýchlostné signály.
Dokončovacie úpravy
Veľmi jemná zrnitosť (~15 %); minimálna halácia na snehových odleskoch; jemná emulácia tlače pre zachovanie vierohodnosti modrej a sýtosti čiernej; viacpásmová dynamika pre zachovanie dunenia krídel bez maskovania odlupujúceho sa zvuku; rám plagátu: drak sa nakláňa cez slnkom osvetlený serak, prúdiaci závej, za ním žiariaci tmavomodrý fjord.
Sora 2
Debbie Mesloh
Caroline Zhao
Publikované 30. septembra MMXXV


