À compter du 26 avril 2026, le produit Sora n'est plus disponible.
Aujourd'hui, nous lançons Sora 2, notre modèle phare de génération vidéo et audio.
Le modèle Sora original de février 2024 a été, à bien des égards, le moment GPT‑1 pour la vidéo — la première fois que la génération vidéo a commencé à sembler fonctionner, et des comportements simples comme la permanence des objets ont émergé de l'augmentation de la puissance de calcul de pré-formation. Depuis, l'équipe Sora s'est concentrée sur la formation de modèles dotés de capacités de simulation du monde plus avancées. Nous croyons que de tels systèmes seront cruciaux pour la formation de modèles d'IA qui comprennent profondément le monde physique. Une étape majeure est la maîtrise de la pré-formation et de la post-formation sur des données vidéo à grande échelle, qui en sont encore à leurs débuts comparées au langage.
Prompt: figure skater performs a triple axle with a cat on her head
Avec Sora 2, nous passons directement à ce que nous croyons être le moment GPT‑3.5 pour la vidéo. Sora 2 peut réaliser des tâches exceptionnellement difficiles, voire impossibles dans certains cas, pour les modèles de génération vidéo antérieurs : des routines de gymnastique olympique, des saltos arrière sur une planche à pagaie qui modélisent avec précision la dynamique de la flottabilité et de la rigidité, et des triples axels pendant qu’un chat s’accroche désespérément.
Prompt: a guy does a backflip
Les modèles vidéo antérieurs sont trop optimistes : ils transforment les objets et déforment la réalité pour réussir à exécuter une invite textuelle. Par exemple, si un joueur de basketball rate son tir, le ballon peut se téléporter spontanément vers le panier. Dans Sora 2, si un joueur de basketball manque un tir, le ballon rebondira sur le panneau. Il est intéressant de noter que les « erreurs » commises par le modèle semblent souvent être des erreurs de l'agent interne que Sora 2 modélise implicitement; bien qu'encore imparfait, il respecte mieux les lois de la physique que les systèmes précédents. Il s'agit d'une capacité extrêmement importante pour tout simulateur de monde utile : vous devez être capable de modéliser l'échec, et pas seulement le succès.
Le modèle représente également un grand pas en avant en matière de contrôlabilité, capable de suivre des instructions complexes couvrant plusieurs plans tout en conservant avec précision l'état du monde. Il excelle dans les styles réalistes, cinématographiques et d'anime.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
En tant que système de génération audio-vidéo polyvalent, il est capable de créer des paysages sonores sophistiqués, des discours et des effets sonores avec un haut degré de réalisme.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Vous pouvez également injecter directement des éléments du monde réel dans Sora 2. Par exemple, en observant une vidéo d'un de nos coéquipiers, le modèle peut les insérer dans n'importe quel environnement généré par Sora avec une représentation précise de leur apparence et de leur voix. Cette capacité est très générale et fonctionne pour tout être humain, animal ou objet.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Le modèle est loin d'être parfait et fait beaucoup d'erreurs, mais cela valide que l'intensification des réseaux neuronaux sur les données vidéo nous rapprochera de la simulation de la réalité.
Sur la route des systèmes de simulation et d'IA à usage général qui peuvent fonctionner dans le monde physique, nous croyons que les gens peuvent beaucoup s'amuser avec les modèles que nous construisons en cours de route.
Nous avons commencé à tester cette fonctionnalité « téléverser vous-même » il y a plusieurs mois au sein de l'équipe Sora, et nous nous sommes tous bien amusés. Cela ressemblait un peu à une évolution naturelle de la communication — des textes aux emojis, aux notes vocales, jusqu’à cela.
Aujourd’hui, nous lançons une nouvelle application sociale iOS simplement appelée « Sora », propulsée par Sora 2. Dans l’application, vous pouvez créer, remixer les créations des autres, découvrir de nouvelles vidéos dans un flux Sora personnalisable et vous intégrer, vous ou vos amis, via une fonctionnalité appelée « personnages ». Avec les personnages, vous pouvez vous intégrer directement dans n’importe quelle scène de Sora avec une fidélité remarquable après un bref enregistrement vidéo et audio unique dans l’application pour vérifier votre identité et capturer votre ressemblance.
La semaine dernière, nous avons lancé l'appli en interne pour tout OpenAI. Nous avons déjà entendu nos collègues dire qu’ils se font de nouveaux amis dans l’entreprise grâce à cette fonctionnalité. Nous croyons qu’une application sociale construite autour de cette fonctionnalité « personnages » est la meilleure façon de vivre la magie de Sora 2.
Les préoccupations concernant le défilement morbide, l’addiction, l’isolement et les flux optimisés en RL sont au premier plan — voici ce que nous faisons à ce sujet.
Nous offrons aux utilisateurs les outils et les options pour contrôler ce qu'ils voient sur le flux. En utilisant les modèles de language existants d'OpenAI, nous avons développé une nouvelle classe d'algorithmes de recommandation qui peuvent être instruits par le langage naturel. Nous disposons également de mécanismes intégrés pour sonder périodiquement les utilisateurs sur leur bien-être et leur offrir de manière proactive la possibilité d'ajuster leur flux.
Par défault, nous vous montrons du contenu fortement biaisé envers les personnes que vous suivez ou avec lesquelles vous interagissez, et donnons la priorité aux vidéos que le modèle réfléchis que vous êtes le plus susceptible d'utiliser comme source d'inspiration pour vos propres créations. Nous n'optimisons pas le temps passé dans le flux, et nous avons explicitement conçu l'appli pour maximiser la création, non la consommation. Vous pouvez trouver plus de détails dans notre Philosophie de flux
Cette appli est conçue pour être utilisée avec vos amis. Les commentaires des testeurs sont sans équivoque : ce sont les personnages qui rendent cet outil différent et amusant à utiliser — il faut l’essayer pour vraiment comprendre, mais c’est une façon nouvelle et unique de communiquer avec les gens. Nous lançons cette appli sur invitation pour vous assurer de venir avec vos amis. À l’heure où toutes les grandes plateformes s’éloignent du graphe social, nous pensons que les personnages renforceront le sentiment de communauté.
Protéger le bien-être des adolescents est important pour nous. Nous mettons en place des limites par défaut sur le nombre de contenus générés que les adolescents peuvent voir par jour dans le fil, et nous déployons également des autorisations plus strictes concernant les personnages pour ce groupe. En plus de nos systèmes de sécurité automatisés, nous augmentons les équipes de modérateurs humains pour vérifier rapidement les cas d’intimidation s’ils surviennent. Nous lançons avec les contrôles parentaux Sora via ChatGPT afin que les parents puissent outrepasser les limites de défilement infini, désactiver la personnalisation de l'algorithme et gérer les paramètres des messages directs.
Avec les personnages, vous avez un contrôle complet sur votre image de bout en bout avec Sora. Vous seul décidez qui peut utiliser votre personnage, et vous pouvez révoquer l’accès ou supprimer toute vidéo qui l’inclut à tout moment. Les vidéos contenant votre personnage, y compris les brouillons créés par d’autres personnes, sont accessibles pour vous en tout temps.
Nous avons abordé de nombreux sujets liés à la sécurité avec cette appli : le consentement concernant l’utilisation de l’image, la provenance, la prévention de la création de contenu préjudiciable, et bien plus encore. Consultez notre document de sécurité Sora 2 pour plus de détails.
Beaucoup de problèmes avec d'autres applis proviennent du modèle de monétisation qui incite à prendre des décisions en contradiction avec le bien-être des utilisateurs. En toute transparence, notre seul plan actuel est de permettre aux utilisateurs de payer un certain montant pour générer une vidéo supplémentaire si la demande dépasse la capacité de calcul disponible. À mesure que l'appli évolue, nous communiquerons ouvertement toute modification dans notre approche ici, tout en continuant de garder le bien-être des utilisateurs comme objectif principal.
Nous sommes au début de ce parcours, mais avec toutes les puissantes façons de créer et de remixer du contenu avec Sora 2, nous voyons cela comme le début d'une ère complètement nouvelle pour les expériences de co-création. Nous sommes convaincus que cette plateforme sera plus saine pour le divertissement et la créativité que celles qui existent actuellement. Nous vous souhaitons beaucoup de plaisir :)
L'appli Sora iOS(s'ouvre dans une nouvelle fenêtre) est disponible pour téléchargement dès maintenant. Vous pouvez vous inscrire dans l’appli pour recevoir une notification poussée lorsque l’accès à votre compte s’ouvre. Nous commençons aujourd'hui le déploiement initial aux États-Unis et au Canada avec l'intention de l'étendre rapidement à d'autres pays. Une fois que vous aurez reçu une invitation, vous pourrez également accéder à Sora 2 via sora.com(s'ouvre dans une nouvelle fenêtre). Sora 2 sera initialement disponible gratuitement, avec des limites généreuses pour commencer, permettant aux utilisateurs d'explorer librement ses capacités, bien que celles-ci soient toujours soumises à des contraintes de calcul. Les utilisateurs de ChatGPT Pro pourront également utiliser notre modèle expérimental de meilleure qualité Sora 2 Pro sur sora.com(s'ouvre dans une nouvelle fenêtre) (et bientôt dans l'appli Sora également). Nous prévoyons également de lancer Sora 2 dans l'API. Sora 1 Turbo restera disponible, et tout ce que vous avez créé continuera d'exister dans votre bibliothèque sora.com(s'ouvre dans une nouvelle fenêtre).
Les modèles vidéo deviennent très performants très rapidement. Les simulateurs de monde à usage général et les agents robotiques transformeront fondamentalement la société et accéléreront le progrès de l'humanité. Sora 2 représente un progrès significatif vers cet objectif. Conformément à la mission d'OpenAI, il est important que l'humanité profite de ces modèles au fur et à mesure de leur développement. Nous croyons que Sora apportera beaucoup de joie, de créativité et de connexion au monde.
— Écrit par Team Sora
Cible principale et visuels
Première lecture : un dragon fendant des aiguilles de glace dentelées, les tourbillons de ses ailes soulevant des embruns; deuxième lecture : la nappe fracturée du glacier s’effondrant dans un fjord de cobalt, le soleil ambré caressant le givre sur les écailles; l'expression traduit un calme prédateur et une puissance sans effort.
Format et apparence
5.0; 4K; obturateur à 180°; émulation de capteurs numériques grand format avec un micro-contraste net; grain très fin; halation contenue sur la neige; aucun tissage de portail.
Lentilles et filtration
Premier plan : plateforme aérienne sphérique de 50 mm montée sur le nez, gyrostabilisée (suivi parallèle avec un léger arc vers l'intérieur). Filtration : Black Pro-Mist 1/8 ; polariseur circulaire réglant la lumière pour atténuer l'éblouissement de la neige tout en préservant l'éclat spéculaire.
Grade / Palette
Lumières : blanc glacé pur avec dégradé froid; tons moyens : bleu acier glacier et cyan pâle; ombres : ardoise/bleu sarcelle avec détails des crevasses préservés; bordure ambrée chaude sur les contours pour la séparation; reflets serrés sur le givre/l'échelle.
Éclairage et atmosphère
Fin d'après-midi, soleil bas en croix; vent catabatique soulevant des embruns; fine brume gelée pour la profondeur; éclats intermittents de poussière de glace dans le sillage; faible vapeur d'haleine du dragon à l'effort.
Emplacement et cadrage
Champ de séracs imposant et crête acérée; la caméra suit à la même vitesse que le dragon à mi-altitude, les diagonales glaciaires conduisant en retour vers le fjord; les ailerons de glace au premier plan passent près pour l'effet de parallaxe; aucune structure humaine.
Garde-robe / Accessoires / Notes sur le véhicule
S.O. (créature). Lecture de surface : crêtes de cornes mates, plaques d’écailles semi-irisées avec micro-givre le long des bords d’attaque.
Son
Cisaillement du vent en haute altitude, tonnerre de la membrane d’aile à chaque battement, tic/craquement cristallin des séracs, grondement du vêlage d’un glacier lointain; expiration/grondement rapide du dragon : « Rrhh— » (sous-1s). Aucun score—pure admiration diégétique.
Liste de prises de vue optimisée (1 prise / 5,0 s)
0,0 – 5,0 — « Découpe parallèle » (50 mm, montage avant avec légère courbure vers l'intérieur et micro-poussée)Nous suivons le dragon alors qu'il se faufile dans un couloir de pics de glace ; les tourbillons à l'extrémité de ses ailes transforment la neige poudreuse en rubans ; un fragment se détache et tombe loin en contrebas, projetant un panache de poudreuse ; la caméra se rapproche doucement — les écailles sont visibles, le bord ambré s'illumine — puis le dragon vire vers le fjord, la queue en ciseaux, projetant une ombre imposante sur le glacier.Objectif : offrir une échelle mythique avec un réalisme tactile en un seul passage décisif — vitesse, masse et froid élémentaire.
Notes de caméra (Pourquoi ça se lit)
50 mm équilibre la présence de la créature et l'échelle du paysage sans miniaturisation; la piste parallèle et l'arc vers l'intérieur accentuent la vitesse et la forme; la micro-poussée est synchronisée avec le plus fort mouvement vers le bas pour une ponctuation puissante; le polariseur de lumière contrôle l'éblouissement tout en conservant l'éclat; le soleil retour/latéral sculpte la silhouette; les ailerons de glace frôlés fournissent des indices de vitesse de parallaxe.
Finition
Grain très fin (~15 %); halo minimal sur les reflets de neige; émulation d'impression douce pour maintenir la crédibilité des bleus et la richesse des noirs; dynamique multibande pour conserver le bruit des ailes sans masquer le grondement du vêlage; cadre de l'affiche : dragon incliné sur un sérac baigné de soleil, embruns ruisselants, fjord d'un bleu profond flamboyant au-delà.
Sora 2
Debbie Mesloh
Caroline Zhao
Publié le 30 septembre MMXXV


