Fra og med 26. april 2026 er ikke Sora-produktet tilgjengelig lenger.
I dag lanserer vi Sora 2: flaggskipmodellen vår for video- og lydgenerering.
Den opprinnelige Sora-modellen fra februar 2024, var på mange måter den store videobegivenheten for GPT‑1. Dette var første gang det så ut som videogenerering fungerte, og enkle atferdsmønstre, som objektpermanens, oppsto etter at datakraften til forhåndstrening økte. Siden den gang har Sora-folkene våre fokusert på å trene opp modeller med mer avanserte evner til å simulere omgivelser. Vi tror at slike systemer vil være avgjørende for å trene opp KI-modeller som med dyp forståelse av den fysiske verdenen. En viktig milepæl i denne sammenheng er å mestre for- og etteropplæring på store videodatasett, som fremdeles er i sin spede begynnelse sammenlignet med språk.
Prompt: figure skater performs a triple axle with a cat on her head
Med Sora 2 går vi rett til det vi mener kan være den store videobegivenheten for OpenAI GPT‑3.5. Sora 2 kan gjøre ting som er utrolig vanskelig – og i noen tilfeller rett og slett umulig – for eldre videogenereringsmodeller, som olympiske turnøvelser med baklengssaltoer på et paddleboard, der dynamikken mellom oppdrift og stivhet nøyaktig gjengis, samt trippel axler mens en katt klamrer seg fast for harde livet.
Prompt: a guy does a backflip
Tidligere videomodeller er overoptimistiske: de vil forvrenge objekter og fordreie virkeligheten for å kunne utføre oppgaver basert på en tekstkommando. Hvis for eksempel en basketspiller bommer på et skudd, kan ballen plutselig teleportere til kurven. I Sora 2 vil ballen sprette tilbake fra bakplaten hvis en basketspiller bommer på et skudd. Det er interessant at «feilene» modellen gjør, ofte ser ut til å være feil begått av den interne agenten som Sora 2 implisitt modellerer. Selv om den fremdeles ikke er perfekt, er den bedre til å følge fysikkens lover sammenlignet med tidligere systemer. Dette er en ekstremt viktig egenskap for enhver brukbar virkelighetssimulator, for man må kunne modellere feil, ikke bare suksesser.
Modellen representerer også et stort fremskritt innen styrbarhet, da den er i stand til å følge kompliserte instruksjoner som strekker seg over flere bilder, samtidig som den nøyaktig forholder seg til virkeligheten. Den utmerker seg på realistiske, filmiske og anime-inspirerte stiler.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Dette er en allsidig video- og lydgenereringsmodell som kan skape sofistikerte bakgrunnslydlandskap, tale og lydeffekter med høy grad av realisme.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
I Sora 2 kan du også direkte innlemme elementer fra den virkelige verden. Ved å for eksempel analysere en video av en av våre kollegaer, kan modellen plassere vedkommende inn i et hvilket som helst Sora-generert miljø, med en nøyaktig gjengivelse av utseende og stemme. Denne funksjonaliteten er svært allsidig og fungerer for alle mennesker, dyr og gjenstander.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Modellen er langt fra perfekt og gjør mange feil, men den bekrefter at ytterligere oppskalering av nevrale nettverk på videodata vil bringe oss nærmere en simulering av virkeligheten.
På veien mot allsidige simulerings- og KI-systemer som kan fungere i den fysiske verden, tror vi at folk kan ha mye moro med modellene vi utvikler underveis.
I Sora-teamet begynte vi å prøve ut denne «last opp deg selv»-funksjonen for flere måneder siden, og vi hadde det veldig gøy. Det føltes som en naturlig kommunikasjonsutvikling: fra tekstmeldinger til emojier til talemeldinger til dette.
Så i dag lanserer vi en ny sosial iOS-app som heter «Sora», basert på Sora 2. I appen kan dere lage og remikse hverandre genereringer, oppdage nye videoer i en Sora-feed du kan tilpasse som du ønsker, og legge til deg selv eller vennene dine via en funksjon kalt «karakterer». Med karakterfunksjonen kan du umiddelbart bli en del av et hvilket som helst Sora-scenario med utrolig naturtro gjengivelse, etter at du har gjort et kort video- og lydopptak i appen for å bekrefte identiteten din og lagre utseendet ditt.
Forrige uke lanserte vi appen internt i hele OpenAI. Vi har allerede hørt fra kollegene våre at de får nye venner på jobben takket være denne funksjonen. Vi mener at en sosial app bygget rundt karakterfunksjonen er den beste måten å oppleve magien i Sora 2 på.
Bekymringer rundt doomscrolling, avhengighet, isolasjon og nyhetsstrømmer som ikke er tilpasset det virkelige liv, står høyt på dagsorden, og dette er det vi gjør med saken:
Vi gir brukerne verktøyene og mulighetene til å ta kontroll over det de ser i feeden. Ved hjelp av OpenAIs eksisterende store språkmodeller har vi utviklet en ny type anbefalingsalgoritmer som kan styres med naturlig språk. Vi har også innebygde mekanismer som med jevne mellomrom spør brukerne om hvordan de har det, og som proaktivt gir dem mulighet til å tilpasse nyhetsstrømmen sin.
Som standard viser vi deg innhold som i stor grad er tilpasset personene du følger eller kommuniserer med, og prioriterer videoer som modellen mener du mest sannsynlig vil bruke som inspirasjon til egne verk. Vi optimaliserer ikke for tiden som brukes i nyhetsfeeden, og vi har bevisst utviklet appen for å maksimere innholdsproduksjonen, ikke innholdsforbruket. Du finner mer informasjon i feedfilosofien vår
Denne appen er laget for å brukes sammen med venner. Den overveldende tilbakemeldingen fra testerne er at karakterene er det som får dette til å føles annerledes og morsomt å bruke – du må prøve det for å virkelig forstå det, for det er en ny og unik måte å kommunisere med andre på. Vi lanserer appen som en invitasjonsbasert tjeneste for å sikre at du kan bruke den sammen med vennene dine. I en tid hvor alle de store plattformene beveger seg bort fra det sosiale nettverket, tror vi at karakterer vil styrke samholdet.
Det er viktig for oss åivareta velværet til tenåringer. Vi innfører standardbegrensninger på hvor mange genereringer tenåringer kan se i nyhetsfeeden hver dag, og for denne gruppen innfører vi også strengere tillatelser for karakterer. I tillegg til de automatiserte sikkerhetssystemene våre, utvider vi antallet menneskelige moderatorer for å kunne behandle tilfeller av mobbing raskt dersom de skulle oppstå. Vi lanserer også foreldrekontroll sammen med Sora via ChatGPT, slik at foreldre kan overstyre begrensningene for uendelig skrolling, slå av algoritmisk tilpasning og administrere innstillingene for direktemeldinger.
Hva gjelder karakterer, så har du full kontroll over dette fra start til slutt med Sora. Det er kun du som bestemmer hvem som kan bruke karakteren din, og du kan når som helst trekke tilbake tillatelsen eller fjerne videoer som inneholder karakteren din. Du kan når som helst se videoer som inneholder en karakter av deg, inkludert utkast laget av andre.
I denne appen har vi tatt for oss mange sikkerhetsrelaterte temaer: samtykke til bruk av bilder, opprinnelse, forebygging av skadelig innhold og mye mer. Du finner mer informasjon i sikkerhetsdokumentet vårt for Sora 2.
Mange problemer med andre apper skyldes at inntektsmodellen oppmuntrer til beslutninger som går på tvers av brukernes velvære. Vår eneste plan er foreløpig å gi brukerne muligheten til å betale et visst beløp for å generere en ekstra video dersom etterspørselen blir for stor i forhold til den tilgjengelige datakraften. Etter hvert som appen utvikler seg, vil vi åpent informere om eventuelle endringer i tilnærmingen vår, samtidig som vi stadig vil ha brukernes velvære som hovedformål.
Vi står ved starten av denne reisen, men med alle de kraftfulle mulighetene for å skape og remikse innhold med Sora 2, ser vi på dette som begynnelsen på en helt ny æra for samarbeidsbaserte opplevelser. Vi er optimistiske og tror at dette vil bli en sunnere plattform for underholdning og kreativitet sammenlignet med det som finnes i dag. Vi håper du får det gøy :)
Sora iOS-appen(åpnes i et nytt vindu) kan lastes ned nå. Du kan registrere deg i appen for å få push-varsler når tilgangen til kontoen din blir aktivert. Vi starter den første utrullingen i USA og Canada i dag, med hensikt om å raskt utvide til flere land. Når du har fått en invitasjon, kan du også bruke Sora 2 på sora.com(åpnes i et nytt vindu). Sora 2 vil i første omgang være gratis, med generøse bruksgrenser i starten, slik at folk fritt kan utforske funksjonene, selv om disse fortsatt er underlagt begrensninger i datakapasiteten. ChatGPT Pro-brukere kan også bruke vår eksperimentelle Sora 2 Pro -modell med høyere kvalitet på sora.com(åpnes i et nytt vindu) (og snart også i Sora-appen). Vi planlegger også å gi ut Sora 2 på API-et. Sora 1 Turbo blir fremdeles tilgjengelig, og alt du har skapt, lever videre i biblioteket ditt på sora.com(åpnes i et nytt vindu).
Videomodeller blir veldig gode, veldig raskt. Allsidige verdenssimulatorer og robotagenter vil fundamentalt endre samfunnet og fremskynde den menneskelige utviklingen. Sora 2 utgjør et betydelig skritt i retning av dette målet. I tråd med OpenAIs formål er det viktig at folk får nytte av disse modellene etter hvert som de utvikles. Vi tror Sora kommer til å bringe mye glede, kreativitet og samhold til verden.
– Skrevet av Sora-teamet
Hovedmotiv og bildespråk
Første beskrivelse: En drage som flyr forbi taggete istopper og vingevirvler som pisker opp snødrev. Andre beskrivelse: En isbres sprukne isdekke skråner mot en koboltblå fjord mens solens ravfargede rand streifer frosten på isflakene. Uttrykket vitner om rovdyraktig ro / uanstrengt kraft.
Format og visuelt uttrykk
5 sek, 4K, 180° lukker, emulering av digital storformatsensor med skarp mikrokontrast, svært finkornet, svak lysrefleks på snøglitter, ingen bildevandring.
Linser og filtrering
Hovedopptak: 50 mm sfærisk linse på en gyrostabilisert luftplattform montert i fronten (parallell sporing med svak bue innover). Filtrering: Black Pro-Mist 1/8; sirkulært polarisasjonsfilter justert for å dempe gjenskinn fra snøen samtidig som den speilende glansen bevares.
Nyanser/fargepalett
Glanslys: rent ishvitt med kjølig overgang. Mellomtoner: stålblå isbre og blek cyanfarge. Skygger: skifergrå/blågrønn med tydelige sprekker, varm ravfarget rand på drageytterkantene for å skille dem ut. Speilreflekser tett på frost og flak.
Belysning og atmosfære
Sen ettermiddagssol med lavtstående krysslys, katabatisk vind som virvler opp snø, en tynn, frossen dis som gir dybde, sporadiske utbrudd av isstøv i kjølvannet, svak åndedrettsdamp fra dragen når den anstrenger seg.
Plassering og komposisjon
En ruvende isbreblokk og en knivskarp fjellrygg, kameraet følger dragen i samme hastighet i middels høyde, diagonale isflater strekker seg tilbake mot fjorden, isfinner i forgrunnen passerer tett foran for å skape parallakse, ingen menneskeskapte strukturer.
Kostymer/rekvisitter/kjøretøy
Ikke aktuelt (dyr). Overflatebeskrivelse: matte fjellrygger, halvskinnende isskrope med en lett matt frostfinish langs framkantene.
Lyd
Kraftig vindskjær, et tordnende sus fra vingemembranene ved hvert nedadgående vingeslag, krystallklart isknak og knirk fra isblokkene, et fjernt drønn fra isbreens kalving; et raskt utpust og rumling fra dragen: «Rrhh—» (under 1 s). Ingen filmmusikk – kun ren diegetisk ærbødighet.
Optimalisert opptaksliste (1 opptak / 5 sek)
0,0–5,0 – «Parallell kantskjæring» (50 mm, frontmontert i luften med svak innadgående bue og svak framoverbevegelse)
Vi følger dragen mens den flyr gjennom en korridor av istårn, virvler fra vingetuppene sprer snødrev i sløyfer, et kalvingsfragment faller langt der nede og sender opp en pulversky, kameraet nærmer seg sakte – flakene blir tydelige, ravgult kantlys blusser opp – så krenger dragen mot fjorden, halen sakser og kaster en feiende skygge over isbreen.
Formål: Å gjengi mytisk storhet med taktil realisme i ett avgjørende sveip – fart, tyngde og elementær kulde.
Kameranotater (hvorfor det fungerer)
50 mm skaper balanse mellom motivets nærvær og landskapets omfang uten å skape miniatyrisert effekt, parallell kamerabevegelse kombinert med en innoverbøyd bue fremhever hastighet og form, mikrobevegelser med kraftig nedadgående bevegelse gir kraftfulle effektmarkeringer, lysfilteret demper gjenskinn samtidig som det bevarer glitring, solen bakfra / i kanten skaper en silhuett, isfinner som nesten treffer motivet gir parallaks-effekter som viser hastighet.
Avslutning
Svært finkornet (~15 %), minimal halo på speilende snøflater, mild utskriftsemulering for å bevare naturtro blåtoner og dype svarttoner, flerbåndsdynamikk for å bevare vingeslagene uten å overdøve lyden av kalvingsbrøl, plakatramme: en drage som svever over en solbelyst isblokk, med snø som virvler og fjorden som gløder i dypblått i bakgrunnen.
Sora 2
Debbie Mesloh
Caroline Zhao
Publisert 30. september MMXXV


