A partire dal 26/04/2026, il prodotto Sora non è più disponibile.
Oggi rilasciamo Sora 2, il nostro modello di generazione video e audio più avanzato.
Il modello Sora originale di febbraio 2024 è stato, per molti versi, il momento GPT‑1 per i video: la prima volta in cui la generazione di video ha iniziato a sembrare funzionante, e comportamenti semplici come la permanenza degli oggetti sono emersi grazie all’aumento del calcolo di pre-addestramento. Da allora, il team Sora si è concentrato sull’addestramento di modelli con capacità avanzate di simulazione del mondo. Riteniamo che tali sistemi saranno fondamentali per addestrare modelli di IA che comprendano profondamente il mondo fisico. Un traguardo importante in questo senso è il padroneggiare il pre-addestramento e il post-addestramento su dati video su larga scala, che sono agli inizi rispetto al linguaggio.
Prompt: figure skater performs a triple axle with a cat on her head
Con Sora 2 passiamo direttamente a quella che pensiamo possa essere la fase GPT‑3.5 per i video. Rispetto ai precedenti modelli di generazione video, Sora 2 può realizzare cose eccezionalmente difficili (e in alcuni casi addirittura impossibili): routine di ginnastica olimpica, capriole all’indietro su una tavola da paddle che riproducono con precisione le dinamiche di galleggiamento e rigidità, e tripli axel mentre un gatto resta aggrappato con tutte le sue forze.
Prompt: a guy does a backflip
I modelli video precedenti sono eccessivamente ottimistici: trasformano gli oggetti e deformano la realtà per eseguire correttamente un prompt. Ad esempio, se un giocatore di basket sbaglia un tiro, la palla potrebbe teletrasportarsi spontaneamente nel canestro. In Sora 2, se un giocatore di basket sbaglia un tiro, la palla rimbalzerà sul tabellone. È interessante notare che gli “errori” commessi dal modello sembrano spesso essere errori dell’agente interno che Sora 2 sta implicitamente modellando; sebbene ancora imperfetto, è migliore nel rispettare le leggi della fisica rispetto ai sistemi precedenti. Questa è una capacità estremamente importante per qualsiasi simulatore di mondo utile: deve essere in grado di utilizzare un modello di fallimento, non solo di successo.
Il modello rappresenta anche un grande passo avanti in termini di controllabilità: è in grado di seguire istruzioni complesse che si estendono su più riprese, mantenendo con precisione lo stato del mondo. Eccelle negli stili realistici, cinematografici e anime.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Essendo un sistema di generazione video-audio per uso generale, è in grado di creare paesaggi sonori di sottofondo sofisticati, discorsi ed effetti sonori con un alto grado di realismo.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Puoi anche inserire direttamente elementi del mondo reale in Sora 2. Ad esempio, osservando il video di uno dei nostri colleghi, il modello può inserirlo in qualsiasi ambiente generato da Sora con una rappresentazione accurata dell’aspetto e della voce. Si tratta di una capacità molto generale che funziona per qualsiasi essere umano, animale o oggetto.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Il modello è tutt’altro che perfetto e commette molti errori, ma conferma che un ulteriore potenziamento delle reti neurali applicate ai dati video ci porterà più vicini alla simulazione della realtà.
Le persone potranno divertirsi molto con i modelli che stiamo costruendo nel percorso verso sistemi di simulazione e di IA per finalità generali in grado di funzionare nel mondo fisico.
Qualche mese fa, nel team Sora, abbiamo iniziato a sperimentare con la funzionalità «carica te stesso» e ci siamo divertiti moltissimo. Sembrava una naturale evoluzione della comunicazione: dai messaggi di testo alle emoji, alle note vocali, fino a questo.
Quindi oggi lanciamo una nuova app social per iOS chiamata semplicemente “Sora”, basata su Sora 2. All’interno dell’app puoi creare, remixare le generazioni degli altri, scoprire nuovi video in un feed Sora personalizzabile e coinvolgere te stesso o i tuoi amici tramite una funzione chiamata “Personaggi”. Grazie alla funzione Personaggi, puoi immergerti direttamente in qualsiasi scena di Sora con una fedeltà straordinaria, dopo una breve registrazione video e audio una tantum nell’app per verificare la tua identità e catturare la tua immagine.
La settimana scorsa abbiamo lanciato l’app internamente per tutto OpenAI. I nostri colleghi ci hanno già riferito che stanno stringendo nuove amicizie in azienda grazie a questa funzionalità. Riteniamo che un’app social basata sulla funzionalità “personaggi” sia il modo migliore per vivere la magia di Sora 2.
Le preoccupazioni relative al doomscrolling, alla dipendenza, all’isolamento e ai feed ottimizzati per RL sono la nostra priorità. Ecco cosa stiamo facendo al riguardo.
Stiamo offrendo agli utenti gli strumenti e le opzioni per avere il controllo su ciò che vedono nel feed. Utilizzando i modelli linguistici di grandi dimensioni esistenti di OpenAI, abbiamo sviluppato una nuova classe di algoritmi di raccomandazione che possono essere istruiti attraverso il linguaggio naturale. Disponiamo inoltre di meccanismi integrati per sondare periodicamente gli utenti sul loro benessere e offrire loro in modo proattivo la possibilità di modificare il feed.
Per impostazione predefinita, mostriamo contenuti fortemente orientati verso le persone che segui o con cui interagisci, dando priorità ai video che il modello ritiene più probabile che tu utilizzi come fonte di ispirazione per le tue creazioni. Non stiamo ottimizzando il tempo trascorso nel feed e abbiamo progettato esplicitamente l’app per massimizzare la creazione, non il consumo. Per maggiori dettagli, consulta la nostra Filosofia sul feed
Questa app è pensata per essere utilizzata con i tuoi amici. In base al feedback travolgente dei tester, i personaggi rendono questo strumento diverso e divertente da usare: bisogna provarlo per capirlo davvero, ma è un modo nuovo e unico di comunicare con le persone. L’accesso all’app avviene mediante invito, per assicurare all’utente di entrare con i propri amici. In un momento in cui tutte le principali piattaforme si stanno allontanando dal social graph, pensiamo che i personaggi rafforzeranno la comunità.
Proteggere il benessere degli adolescenti è importante per noi. Stiamo impostando limiti predefiniti al numero di generazioni che gli adolescenti possono visualizzare al giorno nel feed e stiamo implementando autorizzazioni più severe per i personaggi di questa fascia di utenti. In aggiunta agli stack di sicurezza automatizzati, stiamo ampliando i team di moderatori umani per poter esaminare rapidamente gli eventuali casi di bullismo. Sora viene lanciata con il controllo parentale tramite ChatGPT, in modo che i genitori possano annullare i limiti di scrolling infinito, disattivare la personalizzazione dell’algoritmo e gestire le impostazioni dei messaggi diretti.
Con i personaggi, hai il pieno controllo della tua immagine dall’inizio alla fine con Sora. Solo tu decidi chi può utilizzare il tuo personaggio e puoi revocare l’accesso o rimuovere qualsiasi video che lo includa in qualsiasi momento. Puoi visualizzare in qualsiasi momento i video contenenti un tuo personaggio, comprese le bozze create da altre persone.
Con questa app abbiamo affrontato molti temi legati alla sicurezza: il consenso all’uso dell’immagine personale, la provenienza, la prevenzione della generazione di contenuti dannosi e molto altro. Per maggiori dettagli, consulta la nostra documentazione sulla sicurezza di Sora 2.
Molti problemi con altre app derivano dal modello di monetizzazione che incentiva decisioni in contrasto con il benessere degli utenti. In tutta trasparenza, al momento il nostro unico piano è dare in futuro agli utenti la possibilità di pagare una certa somma per generare un video aggiuntivo, se la domanda dovesse essere eccessiva rispetto alla capacità di calcolo disponibile. Man mano che l’app si evolve, comunicheremo apertamente in questa sede eventuali cambiamenti nel nostro approccio, continuando a mantenere il benessere degli utenti come nostro obiettivo principale.
Siamo solo all’inizio di questo viaggio: ma considerata la potenza offerta per creare e remixare contenuti con Sora 2, prevediamo che sia l’avvio di un’era completamente nuova per le esperienze co-creative. Siamo ottimisti sul fatto che questa sarà una piattaforma più sana per l’intrattenimento e la creatività rispetto a quelle disponibili al momento. Buon divertimento :)
L’ app Sora per iOS(si apre in una nuova finestra) è ora disponibile per il download. Puoi registrarti nell’app per ricevere una notifica push quando il tuo account viene reso disponibile per l’uso. Oggi avviamo il lancio iniziale negli Stati Uniti e in Canada, con l’intenzione di espanderci rapidamente in altri Paesi. Dopo aver ricevuto un invito, potrai accedere a Sora 2 anche tramite sora.com(si apre in una nuova finestra). Inizialmente Sora 2 sarà disponibile gratuitamente e con ampi limiti, in modo che le persone possano esplorarne liberamente le funzionalità, sebbene queste siano ancora soggette a vincoli di calcolo. Gli utenti di ChatGPT Pro potranno inoltre utilizzare il nostro modello sperimentale di qualità superiore Sora 2 Pro su sora.com(si apre in una nuova finestra) (e presto anche nell’app Sora). Abbiamo in programma di rilasciare Sora 2 nell’API. Sora 1 Turbo rimarrà disponibile e tutto ciò che hai creato continuerà a vivere nella tua libreria sora.com(si apre in una nuova finestra).
I modelli video stanno migliorando rapidamente e in modo significativo. I simulatori del mondo per scopi generali e gli agenti robotici rimodelleranno radicalmente la società e accelereranno il progresso umano. Sora 2 rappresenta un progresso significativo verso tale obiettivo. In linea con la missione di OpenAI, è importante che l’umanità tragga vantaggio da questi modelli man mano che vengono sviluppati. Riteniamo che Sora porterà molta gioia, creatività e connessione al mondo.
— Scritto dal team Sora
Obiettivo principale e elementi visivi
Prima lettura: un drago che sfreccia oltre guglie di ghiaccio seghettate, con vortici alle estremità delle ali che sollevano scie di neve; seconda lettura: la lastra fratturata del ghiacciaio che precipita verso un fiordo color cobalto, con il sole ambrato che bacia la brina sulle scaglie; l’espressione trasmette calma predatoria e potenza senza sforzo.
Formato & look
5,0 s; 4K; otturatore a 180°; emulazione di sensore digitale di grande formato con microcontrasto nitido; grana molto fine; aloni contenuti sui riflessi della neve; nessun effetto gate weave.
Lenti e filtraggio
Hero: piattaforma aerea girostabilizzata con lente sferica da 50 mm montata sul muso (tracciamento parallelo con un leggero arco verso l’interno). Filtrazione: Black Pro-Mist 1/8; polarizzatore circolare regolato per ridurre i riflessi della neve mantenendo la brillantezza speculare.
Gradazione / palette
Luci: bianco ghiaccio pulito con sfumatura fredda; toni medi: ghiacciaio blu acciaio e aria ciano pallido; ombre: ardesia/verde acqua con dettagli dei crepacci preservati; bordo ambrato caldo sui bordi del drago per la separazione; riflessi speculari concentrati su gelo/squame.
Illuminazione e atmosfera
Sole basso del tardo pomeriggio come luce chiave incrociata; vento catabatico che solleva spindrift; sottile foschia ghiacciata per dare profondità; raffiche intermittenti di polvere di ghiaccio nella scia; debole vapore del respiro del drago sotto sforzo.
Posizione e inquadratura
Imponente campo di seracchi e cresta affilata; la telecamera segue il drago alla stessa velocità a media altitudine, con le diagonali del ghiacciaio che conducono verso il fiordo; le pinne di ghiaccio in primo piano passano vicine per creare parallasse; nessuna struttura umana visibile.
Vestiario / Oggetti di scena / Note sul veicolo
N/D (creatura). Lettura superficiale: creste cornee opache, placche squamose semi-iridescenti con micro-brina lungo i bordi d’attacco.
Suono
Taglio del vento ad alta quota, rombo della membrana alare a ogni battito discendente, ticchettio e scricchiolio del ghiaccio cristallino dai seracchi, lontano boato del distacco del ghiacciaio; rapida espirazione e rombo del drago: «Rrhh—» (meno di 1 secondo). Nessun punteggio: puro stupore diegetico.
Elenco scatti ottimizzato (1 scatto / 5,0 secondi)
0,0–5,0 "Intaglio parallelo della cresta" (50 mm, ripresa aerea con attacco frontale, leggero arco verso l’interno e micro-spinta)
Teniamo il passo del drago mentre si infila in un corridoio di guglie di ghiaccio; i vortici alle estremità delle ali trascinano la neve sollevata in nastri; un frammento che si stacca precipita molto più in basso, sollevando un pennacchio di polvere. La telecamera si avvicina dolcemente: le squame risultano leggibili, il bordo ambrato divampa. Poi il drago vira inclinandosi verso il fiordo, la coda che sforbicia l’aria, proiettando un’ampia ombra sul ghiacciaio.
Scopo: offrire una dimensione mitologica con realismo tattile in un unico passaggio decisivo: velocità, massa e freddo elementare.
Note di ripresa (Perché la scena si legge)
Il 50 mm bilancia la presenza della creatura e la scala del paesaggio senza miniaturizzare; l’inseguimento parallelo + l’arco verso l’interno rendono credibili velocità e forma; la micro-spinta sincronizzata con il colpo d’ala discendente più forte aggiunge un accento di potenza; il polarizzatore leggero controlla i riflessi preservando lo scintillio; il sole in controluce/rim light scolpisce la silhouette; le lame di ghiaccio sfiorate forniscono segnali di velocità tramite parallasse.
Finitura
Grana molto fine (~15%); aloni minimi sui riflessi speculari della neve; delicata emulazione di stampa per mantenere i blu realistici e i neri intensi; dinamica multibanda per preservare il tonfo delle ali senza coprire il boato del distacco del ghiaccio; fotogramma del poster: drago in virata sopra un seracco illuminato dal sole, con scie di neve sollevata e un fiordo di un blu profondo sullo sfondo.
Sora 2
Debbie Mesloh
Caroline Zhao
Pubblicato il 30 settembre MMXXV


