Od 26. dubna 2026 už produkt Sora nebude k dispozici.
Dnes vydáváme Sora 2, náš vlajkový model pro generování videa a zvuku.
Původní model Sora z února 2024 byl v mnoha ohledech pro video tím, čím byl GPT‑1 pro text – poprvé se generování videa začalo opravdu dařit a při navýšení výpočetního výkonu při předtrénování se zároveň spontánně objevily i základní jevy, jako je trvalost objektů. Od té doby se tým Sora zaměřuje na školení modelů s pokročilejšími schopnostmi simulace světa. Věříme, že takové systémy budou klíčové pro školení modelů umělé inteligence, jež budou schopny skutečně chápat fyzický svět. Klíčovým krokem k tomu bude zvládnout předtrénování a následné trénování na velkých objemech video dat, které jsou oproti jazykovým modelům zatím v rané fázi vývoje.
Prompt: figure skater performs a triple axle with a cat on her head
Se Sora 2 skočíme přímo k tomu, co si myslíme, že by mohlo být fází GPT‑3.5 pro video. Sora 2 dokáže dělat věci, které jsou pro předchozí modely generování videa mimořádně obtížné – a v některých případech přímo nemožné: olympijské gymnastické sestavy, backflipy na paddleboardu, které přesně modelují dynamiku vztlaku a tuhosti, a trojité axely, zatímco se kočka drží zuby nehty.
Prompt: a guy does a backflip
Předchozí modely videa jsou příliš optimistické – mění objekty a deformují realitu, aby úspěšně splnily textový prompt. Například, pokud basketbalista mine střelu, míč se může samovolně teleportovat do koše. Pokud basketbalista ve hře Sora 2 netrefí koš, odrazí se míč od zadní desky. Zajímavé je, že „chyby“, které model dělá, se často zdají být chybami interního agenta, kterého Sora 2 implicitně modeluje; i když je stále nedokonalý, lépe dodržuje fyzikální zákony ve srovnání s předchozími systémy. To je nesmírně důležitá schopnost pro každý užitečný simulátor světa – musíš být schopen modelovat neúspěch, nejen úspěch.
Model zároveň představuje velký krok vpřed v oblasti ovladatelnosti – dokáže se řídit i složitými pokyny, které se týkají více záběrů, a přitom zachovávat konzistentní stav prostředí. Vyniká v realistických, filmových a anime stylech.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Jako univerzální systém pro generování videa a zvuku dokáže vytvářet sofistikované zvukové kulisy, řeč a zvukové efekty s vysokou mírou realismu.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Do Sora 2 můžeš také přímo vložit prvky skutečného světa. Například na základě pozorování videa jednoho z našich spoluhráčů může model to osobu vložit do jakéhokoli prostředí vytvořeného Sora s přesným zobrazením vzhledu a hlasu. Tato schopnost je velmi obecná a funguje pro jakéhokoli člověka, zvíře nebo objekt.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Model není zdaleka dokonalý a dělá spoustu chyb, ale potvrzuje, že další rozšiřování neurálních sítí na video datech nás přiblíží k simulaci reality.
Domníváme se, že na cestě k univerzální simulaci a systémům umělé inteligence, které dokážou fungovat ve fyzickém světě, si lidé užijí spoustu zábavy s modely, které po této cestě vytváříme.
Poprvé jsme si s touto funkcí „nahrát sám sebe“ začali hrát před několika měsíci v týmu Sora a všichni jsme si s ní užili spoustu zábavy. Připadalo nám to jako přirozený vývoj komunikace – od textových zpráv přes emotikony a hlasové poznámky až k tomuto.
Takže dnes spouštíme novou sociální aplikaci pro iOS s názvem „Sora“, založenou na Sora 2. V aplikaci můžete vytvářet, remixovat výtvory ostatních, objevovat nová videa v přizpůsobitelném kanálu Sora a vkládat sebe nebo své přátele prostřednictvím funkce zvané postavy. Pomocí postav můžeš sám sebe vložit přímo do libovolné scény v aplikaci Sora s pozoruhodnou věrností. Stačí krátká jednorázová nahrávka videa a zvuku v aplikaci, která ověří tvou identitu a zachytí tvou podobu.
Minulý týden jsme aplikaci interně spustili pro všechny v OpenAI. Už jsme slyšeli od našich kolegů, že si díky této funkci ve firmě dělají nové přátele. Myslíme si, že sociální aplikace postavená na této funkci „postav“ je nejlepší způsob, jak zažít kouzlo Sora 2.
Víme o problémech, jako je bezmyšlenkovité scrollování, závislosti, izolace a algoritmicky „optimalizované“ feedy – a tady popisujeme, co s tím děláme.
Dáváme uživatelům nástroje a možnosti, aby měli kontrolu nad tím, co vidí na svém feedu. S využitím stávajících velkých jazykových modelů OpenAI jsme vyvinuli novou třídu doporučovacích algoritmů, které lze ovládat prostřednictvím přirozeného jazyka. Máme také vestavěné mechanismy pro pravidelné dotazování uživatelů na jejich pohodu a proaktivně jim dáváme možnost upravit jejich feed.
Ve výchozím nastavení vám zobrazujeme obsah, který je silně zaměřený na lidi, které sledujete nebo s nimiž komunikujete, a upřednostňujeme videa, o nichž si model myslí, že je nejpravděpodobněji použijete jako inspiraci pro své vlastní výtvory. Neoptimalizujeme čas strávený ve feedu a aplikaci jsme výslovně navrhli tak, aby maximalizovala tvorbu, ne spotřebu. Více informací naleznete v naší filozofii feedů
Tato aplikace je určena k používání s tvými přáteli. Převládající zpětná vazba od testerů je, že postavy jsou tím, co dělá tuto aplikaci jinou a zábavnou – musíš si to vyzkoušet, abys to opravdu pochopil. Je to nový a jedinečný způsob komunikace s lidmi. Aplikaci zavádíme jako pozvánkovou, abys mohl přijít s přáteli. V době, kdy se všechny hlavní platformy odklánějí od sociálního grafu, věříme, že postavy posílí komunitu.
Ochrana pohody dospívajících je pro nás důležitá. Zavádíme výchozí omezení na počet generovaných videí, které mohou teenageři denně vidět ve feedu, a také zavádíme přísnější oprávnění pro postavy pro tuto skupinu. Kromě našich automatizovaných bezpečnostních systémů rozšiřujeme týmy lidských moderátorů, aby rychle zkontrolovali případy šikany, pokud k nim dojde. Spouštíme s aplikací Sora rodičovské kontroly prostřednictvím ChatGPT, aby rodiče mohli přepsat nekonečné limity scrollování, vypnout personalizaci algoritmů a spravovat nastavení přímých zpráv.
S postavami máš v aplikaci Sora svou podobu pod kontrolou od začátku do konce. Jen ty rozhoduješ, kdo může použít tvou postavu, a můžeš kdykoli zrušit přístup nebo odebrat jakékoli video, které ji obsahuje. Videa obsahující tvou postavu, včetně návrhů vytvořených jinými lidmi, si můžeš kdykoli prohlédnout.
U této aplikace jsme se zabývali mnoha bezpečnostními tématy – souhlas s použitím podobizny, původ, prevence generování škodlivého obsahu a mnoho dalšího. Další podrobnosti najdete v našem dokumentu o bezpečnosti Sora 2.
Mnoho problémů s jinými aplikacemi pramení z modelu monetizace, který motivuje k rozhodnutím, jež jsou v rozporu s pohodou uživatelů. Transparentně řečeno, naším jediným současným plánem je nakonec dát uživatelům možnost zaplatit určitou částku za vytvoření dalšího videa, pokud je poptávka příliš velká vzhledem k dostupným výpočetním prostředkům. Jak se aplikace vyvíjí, budeme zde otevřeně informovat o jakýchkoli změnách v našem přístupu, přičemž budeme pokračovat v kladení důrazu na pohodu uživatelů jako naší hlavní prioritu.
Jsme teprve na začátku, ale díky všem úžasným možnostem, které Sora 2 nabízí pro tvorbu a remixování obsahu, to vnímáme jako začátek zcela nové éry společné kreativity. Jsme optimističtí a věříme, že to bude zdravější platforma pro zábavu a kreativitu ve srovnání s tím, co je k dispozici nyní. Doufáme, že se budeš dobře bavit :)
Aplikace Sora pro iOS(otevře se v novém okně) je nyní k dispozici ke stažení. V aplikaci se můžeš zaregistrovat se k odběru push oznámení, když se otevře přístup k tvému účtu. Dnes zahajujeme počáteční zavádění v USA a Kanadě a máme v plánu rychle expandovat i do dalších zemí. Po obdržení pozvánky budeš mít přístup k Sora 2 také prostřednictvím sora.com(otevře se v novém okně). Sora 2 bude zpočátku k dispozici zdarma, s velkorysými limity pro začátek, aby lidé mohli volně prozkoumat její schopnosti, i když stále podléhají výpočetním omezením. Uživatelé ChatGPT Pro budou moci také používat náš experimentální, kvalitnější model Sora 2 Pro na sora.com(otevře se v novém okně) (a brzy i v aplikaci Sora). Také plánujeme vydat Sora 2 v rozhraní API. Sora 1 Turbo zůstane k dispozici a vše, co jsi vytvořil, bude i nadále žít ve tvé knihovně na sora.com(otevře se v novém okně).
Video modely se velmi rychle zlepšují. Simulátory světa pro všeobecné účely a robotičtí agenti zásadně přetvoří společnost a urychlí vývoj lidského pokroku. Sora 2 představuje významný pokrok směrem k tomuto cíli. V souladu s posláním OpenAI je důležité, aby z těchto modelů měla prospěch celá společnost už během jejich vývoje. Myslíme si, že Sora přinese světu spoustu radosti, kreativity a spojení.
— Napsal tým Sora
Primární cíl a vizuály
První čtení: drak proplétající se kolem zubatých ledových jehlanů, víry na koncích křídel odlupující sněhový prach; druhé čtení: rozlámaný ledovcový příkrov padající do kobaltového fjordu, jantarový okraj slunce líbajícím mráz na šupinách; výraz vyjadřuje dravý klid / sílu bez námahy.
Formát a vzhled
5,0s; 4K; závěrka 180°; emulace velkoformátového digitálního senzoru s ostrým mikrokontrastem; velmi jemné zrno; omezená halace na sněhových odlescích; žádné chvění brány.
Objektivy a filtrace
Hero: 50mm sférický objektiv na gyroskopicky stabilizované letecké plošině na přídi (paralelní sledování s mírným obloukem dovnitř). Filtrace: Black Pro-Mist 1/8; kruhový polarizátor nastavuje světlo tak, aby zkrotil oslnění sněhu a zároveň zachoval lesk odrazů.
Tón / Paleta
Přednosti: čistá ledově bílá s chladným přechodem; Střední tóny: ocelově modrý ledovec a světle azurový vzduch; Stíny: břidlicová/šedozelená se zachovanými detaily trhlin; teplý jantarový okraj na dračích hranách pro oddělení; odlesky těsně na námraze/šupině.
Osvětlení a atmosféra
Pozdně odpolední nízké slunce s křížovým osvětlením; katabatický vítr unášející sněhový prach; řídký zmrzlý opar pro hloubku; občasné výbuchy ledového prachu v závěsu; slabá dechová pára z draka při námaze.
Umístění a orámování
Tyčící se serakové pole a ostrý hřeben; kamera sleduje draka ve stejné rychlosti ve střední výšce, ledovcové úhlopříčky směřují zpět k fjordu; ledové ploutve v popředí procházejí blízko kvůli paralaxe; žádné lidské stavby.
Kostýmy / Rekvizity / Poznámky k vozidlu
N/A (tvor). Povrchová úprava: matné rohové hřebeny, poloduhové šupinové destičky s mikronámrazou na náběžné straně.
Zvuk
Vysoké vzdušné střihy, hrom membrány křídel při každém úderu dolů, krystalický led cvakání/vrzání ze seraků, vzdálený rachot odlomení ledovce; rychlý výdech/hřmot od draka: „Rrhh—“ (pod 1s). Bez hudebního doprovodu – jen čistý diegetický úžas.
Optimalizovaný seznam záběrů (1 záběr / 5,0 s)
0,0–5,0 — „Parallel Ridge Carve“ (50 mm, anténa na přídi s mírným vnitřním obloukem & micro-push)
Sledujeme draka, jak se proplétá koridorem ledových věží; víry na koncích křídel odtrhávají sněhový prach do stuh; daleko pod námi padá úlomek z tání a vysílá prachový oblak; kamera se přibližuje—záběr na šupiny, jantarový okraj se rozzáří—pak se drak nakloní směrem k fjordu, mává ocasem, vrhá široký stín na ledovec.
Účel: Přinést mýtické měřítko s hmatatelným realismem v jednom rozhodujícím kroku—rychlost, hmotnost a elementární chlad.
Poznámky ke kameře (Proč to funguje)
Objektiv 50 mm vyvažuje přítomnost tvora a měřítko krajiny, aniž by scénu zmenšoval; rovnoběžný pohyb kamery s mírným obloukem dovnitř zdůrazňuje rychlost a tvar; drobné přiblížení je načasované na nejsilnější mávnutí křídel pro úderný efekt; lehký polarizační filtr omezuje odlesky, ale zachovává třpyt; slunce zezadu a z boku vykresluje siluetu; těsné prolétnutí kolem ledových výběžků vytváří paralaxní iluzi rychlosti.
Dokončení
Velmi jemné zrno (~15 %); halace na lesklém sněhu minimální; jemná simulace filmového tisku, aby modré tóny působily věrohodně a černá zůstala sytá; vícepásmová dynamika pro zachování úderu křídel, aniž by potlačila dunění odlamujícího se ledu; úvodní snímek: drak nakloněný v letu nad sluncem ozářeným ledovcem, za ním víří sněhový prach a fjord září sytě modře v dálce.
Sora 2
Debbie Mesloh
Caroline Zhao
Publikováno 30. září MMXXV


