Od 26. aprila 2026 naprej izdelek Sora ne bo več na voljo.
Danes je zaživela aplikacija Sora 2, ki je naš vodilni model za ustvarjanje videoposnetkov in zvoka.
Izvirni model Sora je bil februarja 2024 v mnogih pogledih prelomnica za video, primerljiva z GPT‑1 – prvič se je zdelo, da generiranje videa dejansko deluje, in preprosta vedenja, kot je permanentnost objektov (object permanence), so se pojavila zaradi povečevanja računske zmogljivosti pri predhodnem učenju modela. Od takrat se ekipa Sora osredotoča na učenje modelov z naprednejšimi zmožnostmi simulacije sveta. Verjamemo, da bodo takšni sistemi ključni za učenje modelov umetne inteligence, ki globoko razumejo fizični svet. Pomemben mejnik pri tem je obvladovanje predhodnega učenja in dodatnega prilagajanja na obsežnih video podatkih, ki so v primerjavi z jezikom še vedno v zgodnji fazi razvoja.
Prompt: figure skater performs a triple axle with a cat on her head
S Soro 2 se podajamo naravnost tja, kjer bi lahko napočil trenutek zmage modela GPT‑3.5 za videoposnetke. Sora 2 zmore stvari, ki so bile za prejšnje modele za ustvarjanje videa izjemno zahtevne, v nekaterih primerih celo povsem nemogoče: olimpijske gimnastične vaje, salte nazaj na deski za veslanje z natančnim upoštevanjem dinamike vzgona in togosti ter skok trojnim obratom mačke, ki komajda še drži ravnotežje.
Prompt: a guy does a backflip
Prejšnji modeli videoposnetkov so preveč optimistični: v imenu natančne izvedbe poziva bodo raje spremenili obliko predmeta in izkrivljali resničnost. Na primer, če košarkar zgreši met, se lahko žoga sama od sebe kar prenese čez obroč. V Sori 2 pa je tako, da če košarkar zgreši met, se bo žoga odbila od table. Zanimivo je, da se »napake«, ki jih model naredi, pogosto zdijo napake notranjega agenta, ki ga Sora 2 implicitno modelira; čeprav še vedno ni popoln, bolje upošteva zakone fizike kot prejšnji sistemi. To je izredno pomembna zmogljivost za vsak uporaben simulator sveta—morate biti sposobni uporabiti model neuspeha, ne le uspeha.
Model predstavlja tudi velik korak naprej v nadzorljivosti, saj lahko sledi zapletenim navodilom, ki zajemajo več posnetkov, in pri tem natančno ohranja stanje sveta. Odlikuje se v realističnih, kinematografskih in anime stilih.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Kot večnamenski sistem za ustvarjanje videa in zvoka je sposoben ustvarjati prefinjene zvočne kulise, govor in zvočne učinke z visoko stopnjo realističnosti.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
V Soro 2 lahko neposredno vnesete tudi elemente resničnega sveta. Na primer, z opazovanjem videoposnetka enega od naših članov ekipe lahko model to osebo vstavi v katero koli okolje, ustvarjeno s Soro, pri čemer natančno prikaže njen videz in glas. Ta zmožnost je zelo splošna in deluje za vsakega človeka, žival ali predmet.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Model je daleč od popolnosti in dela številne napake, vendar potrjuje, da nas nadaljnje povečevanje nevronskih mrež na video podatkih približuje simulaciji resničnosti.
Na poti k večnamenski simulaciji in k umetni inteligenci, ki lahko deluje v fizičnem svetu, verjamemo, da se bodo ljudje lahko zelo zabavali z modeli, ki jih razvijamo na tej poti.
To funkcijo »naloži samega sebe« smo v ekipi Sore prvič začeli preizkušati pred nekaj meseci in pri tem smo se res odlično zabavali. Zdelo se je kot naravna evolucija komunikacije – od besedilnih sporočil do smeškov, od glasovnih sporočil do tega.
Danes predstavljamo novo družabno aplikacijo za iOS z imenom »Sora«, ki jo poganja Sora 2. V aplikaciji lahko ustvarjate, predelujete generacije drugih uporabnikov, odkrivate nove videe v prilagodljivem viru Sora ter vključite sebe ali svoje prijatelje prek funkcionalnosti »liki«. S funkcionalnostjo characters se lahko neposredno vključite v katerikoli prizor Sora z izjemno natančnostjo, potem ko v aplikaciji opravite enkratno kratko snemanje videa in zvoka za preverjanje identitete in zajem vašega videza.
Prejšnji teden smo aplikacijo interno uvedli za vse v podjetju OpenAI. Od sodelavcev smo že slišali, da zaradi te funkcionalnosti sklepajo nova prijateljstva v podjetju. Menimo, da je družbena aplikacija, zgrajena okoli funkcionalnosti »characters«, najboljši način za doživetje zmogljivosti Sora 2.
Nenehno podrsavanje po zaslonu, zasvojenost, osamljenost in pritegnitev pozornosti so naše prioritete. Zato smo ukrepali.
Uporabnikom dajemo orodja in možnosti, da bodo imeli nadzor nad tem, kar vidijo v viru. Na podlagi obstoječih velikih jezikovnih modelov OpenAI smo razvili novo vrsto priporočilnih algoritmov, ki jih je mogoče upravljati z navodili v naravnem jeziku. Imamo tudi vgrajene mehanizme, ki občasno preverjajo počutje uporabnikov in jim proaktivno ponudijo možnost, da prilagodijo svoj vir vsebin.
Privzeto vam prikazujemo vsebine, ki so močno usmerjene na osebe, ki jim sledite ali z njimi komunicirate, ter dajemo prednost videom, za katere model ocenjuje, da vam bodo najverjetneje služili kot navdih za lastne stvaritve. Ne optimiziramo za čas, preživet v viru, temveč smo aplikacijo izrecno zasnovali za spodbujanje ustvarjanja, ne zgolj spremljanja vsebin. Več o tem najdete v naši Filozofiji vira
Ta aplikacija je narejena za uporabo z vašimi prijatelji. Pretežni odzivi testnih uporabnikov kažejo, da prav funkcionalnost characters ustvarja občutek drugačnosti in zabavnosti – to je treba preizkusiti, da se razume, saj predstavlja nov in edinstven način komuniciranja z drugimi. Aplikacijo uvajamo na podlagi povabil, da zagotovimo, da se pridružite skupaj s prijatelji. V času, ko se večina večjih platform oddaljuje od družbenega grafa, menimo, da bodo characters okrepili skupnost.
Za nas je pomembno varovanje dobrega počutja mladoletnikov. Privzeto uvajamo omejitve glede števila generacij, ki jih lahko mladoletniki dnevno vidijo v viru, ter hkrati uvajamo strožje nastavitve dovoljenj za funkcionalnost characters za to skupino. Poleg naših avtomatiziranih varnostnih sistemov povečujemo ekipe človeških moderatorjev, da bodo lahko hitro obravnavali primere ustrahovanja, če se pojavijo. Ob lansiranju uvajamo tudi starševski nadzor Sora prek ChatGPT, ki staršem omogoča, da preglasijo omejitve neskončnega drsenja, izklopijo personalizacijo algoritma ter upravljajo nastavitve neposrednih sporočil.
S funkcionalnostjo likov imate v sistemu Sora popoln nadzor nad svojim videzom od začetka do konca. Samo vi lahko določite, kdo lahko uporablja vaš character, ter lahko kadar koli prekličete dostop ali odstranite katerikoli video, ki ga vsebuje. Videi, ki vsebujejo vaš character, vključno z osnutki, ki jih ustvarijo drugi, so vam kadar koli na voljo za ogled.
Pri tej aplikaciji smo obravnavali številne varnostne vidike – soglasje za uporabo videza, izvor vsebine, preprečevanje ustvarjanja škodljive vsebine in še več. Za več podrobnosti si oglejte dokument o varnosti Sore 2.
Številne težave drugih aplikacij izhajajo iz modela monetizacije, ki spodbuja odločitve v nasprotju z dobrobitjo uporabnikov. Naš edini trenutni načrt je, da bomo uporabnikom kasneje ponudili možnost plačila manjšega zneska za ustvarjanje dodatnega videoposnetka, če bo povpraševanje preseglo razpoložljive računske zmogljivosti. Ko se bo aplikacija razvijala, bomo o vseh spremembah našega pristopa tukaj odkrito obveščali, pri tem pa bomo še naprej postavljali dobrobit uporabnikov v ospredje.
Smo še n azačetku, vendar v vseh mogočnih načinih ustvarjanja in predelovanja vsebin s Soro 2 vidimo začetek povsem nove dobe sodelovalnih ustvarjalnih izkušenj. Optimizem nam vliva prepričanje, da bo ta platforma za zabavo in ustvarjalnost bolj zdrava od tistega, kar je na voljo danes. Upamo, da se boste lepo imeli :)
Aplikacijo Sora za iOS(odpre se v novem oknu) si lahko že prenesete. V aplikaciji se lahko prijavite na potisno obvestilo, ki vas bo obvestilo, ko bo dostop omogočen za vaš račun. Danes začenjamo začetno uvedbo v ZDA in Kanadi z namenom, da jo kmalu razširimo še na druge države. Ko boste prejeli povabilo, boste lahko do Sore 2 dostopali tudi na strani sora.com(odpre se v novem oknu). Sora 2 bo sprva na voljo brezplačno, z velikodušnimi omejitvami, ki omogočajo prosto raziskovanje njegovih zmogljivosti, vendar so te še vedno odvisne od razpoložljive računske infrastrukture. Uporabniki ChatGPT Pro bodo prav tako lahko uporabljali naš eksperimentalni, kakovostnejši model Sora 2 Pro, in sicer na strani sora.com(odpre se v novem oknu) (in kmalu tudi v aplikaciji Sora). Prav tako načrtujemo izdajo Sora 2 v API-ju. Sora 1 Turbo bo ostala na voljo, vse, kar ste ustvarili, pa bo še naprej dostopno v vaši knjižnici na strani sora.com(odpre se v novem oknu).
Video modeli postajajo zelo zmogljivi in to zelo hitro. Večnamenski simulatorji sveta in robotski agenti bodo temeljito preoblikovali družbo ter pospešili potek človeškega napredka. Sora 2 predstavlja pomemben korak naprej k temu cilju. V skladu s poslanstvom OpenAI je pomembno, da ima človeštvo korist od teh modelov že med njihovim razvojem. Verjamemo, da bo Sora v svet prinesla veliko veselja, ustvarjalnosti in povezanosti.
— Napisala: ekipa Sora
Glavni motiv in vizualna zasnova
Prvi pogled: zmaj, ki frči mimo nazobčanih ledenih vrhov, za njegovimi krili se vrtinči droben snežni prah. Drugi pogled: kosi razpokanega ledenika padajo v kobaltni fjord, jantarni rob sonca se nežno dotika srebrne slane na njegovih luskah. Izraz zmaja odseva umirjenost plenilca / lahkotno moč.
Format in videz
5,0 s; 4K; 180° zaklop; emulacija digitalnega senzorja velikega formata z ostrim mikro kontrastom; zelo fina zrnatost; zadržan sijaj okoli odbleskov snega; brez premikanja filmskega okvirja.
Leče in filtracija
Glavni lik: 50-milimetrska okrogla zračna platforma za na nos s stabilizacijo žiroskopa (prilagaja se obrisu z ukrivljenostjo navznoter). Filtracija: Black Pro-Mist 1/8; krožni polarizacijski filter z rahlo nastavljeno svetlobo za umiritev bleščanja snega ob ohranjanju iskrivih odbleskov.
Barvna obdelava / paleta
Svetli toni: čista ledeno bela z mehkim prehodom v hladnejše odtenke. Srednji toni: jekleno moder ledenik in svetel cianov zrak.Temni toni: skrilasto modra in modrozelena z ohranjenimi podrobnostmi razpok; topel jantarni sij ob robovih zmaja zagotavlja jasnejšo ločitev; odbleski ostajajo ostri na slani/luskah.
Osvetlitev in atmosfera
Poznopopoldansko nizko sonce z navzkrižno osvetlitvijo; katabatični veter dviguje snežni prah; tanka plast zmrznjene meglice ustvarja globino; občasni oblaki ledenega prahu v sledovih gibanja; nežen izdih pare iz zmajevih ust ob naporu.
Lokacija in kader
Veličasten ledeniški labirint z visokimi stolpi serakov in ostrim grebenom; kamera sledi zmaju s srednje višine pri enaki hitrosti, diagonale ledenika vodijo pogled nazaj proti fjordu; ledeni plavži v ospredju drsijo mimo za učinek paralakse; brez človeških struktur.
Garderoba / Rekviziti / Opombe
Ni podatkov (bitje). Površina: matirani grebeni in biserni lesk lusk z drobno slano ob sprednjih robovih.
Zvok
Striženje vetra v višjih plasteh, donenje kril ob vsakem zamahu navzdol, pokanje/škripanje kristalnega ledu v serakih, oddaljen pok ob lomljenju ledenika; hiter izdih/renčanje zmaja: 'Rrhh—' (manj kot sekunda). Brez ocene–čisto diegetično doživljanje.
Optimiziran seznam posnetkov (1 posnetek / 5,0 s)
0,0–5,0 —»Vzporedni rez grebena« (50 mm, zračna kamera na nosu z rahlim notranjim lokom in nežnim približevanjem)
Sledimo zmaju, kako se vije skozi koridor ledenih vrhov; vrtinci na konicah kril raznašajo snežni prah; kos ledenika se odlomi in daleč spodaj sproži oblak snežnega prahu; kamera se počasi približuje – lusk imajo jantarni sij – nato se zmaj nagne proti fjordu, rep se zamaje kot škarje in meče senco čez ledenik.
Namen: Zagotoviti mitično razsežnost z otipljivim realizmom v enem odločilnem gorskem prelazu s hitrostjo, maso in elementarni mrazom.
Opombe o kameri (zakaj deluje)
50 mm uravnava prisotnost bitja in merilo pokrajine, ne da bi delovalo pomanjšano; vzporedno sledenje z rahlim notranjim lokom poudari hitrost in obliko; rahlo približevanje je usklajeno z najmočnejšim zamahom kril in poudari občutek moči; lahek polarizacijski filter zmanjša bleščanje, a ohrani iskrivost; sonce od zadaj in ob strani izriše obris; ledeni plavži v skorajšnjih preletih ustvarjajo učinek hitrosti s paralakso.
Končna obdelava
zelo fina zrnatost (~15 %); minimalna halacija na snežnih odbleskih; nežna emulacija filmskega tiska ohranja verodostojne modre odtenke in bogato črnino; večpasovna dinamika ohranja udar kril, ne da bi prekrila grom ob podiranju ledenika; naslovni kader: zmaj v zavoju čez obsijan ledeni stolp, sledi snežnega prahu se raztezajo za njim, fjord pa v ozadju žari v globoki modrini.
Sora 2
Debbie Mesloh
Caroline Zhao
Objavljeno 30. septembra 2025


