Chegou o Sora 2
Nosso modelo mais recente de geração de vídeo é mais preciso fisicamente, mais realista e mais controlável do que sistemas anteriores. Ele também inclui diálogos e efeitos sonoros sincronizados. Crie com ele no novo app Sora.
A partir de 26 de abril de 2026, o produto Sora deixará de estar disponível.
Hoje, estamos lançando o Sora 2, nosso principal modelo de geração de vídeo e áudio.
O modelo Sora original, de fevereiro de 2024, foi, em muitos sentidos, o momento GPT‑1 para vídeo — a primeira vez em que a geração de vídeo começou a parecer que estava funcionando, e comportamentos simples como permanência de objetos surgiram a partir do aumento da computação de pré-treinamento. Desde então, a equipe do Sora tem se concentrado em treinar modelos com capacidades mais avançadas de simulação de mundo. Acreditamos que esses sistemas serão essenciais para treinar modelos de IA que compreendam profundamente o mundo físico. Um marco importante para isso é dominar o pré-treinamento e o pós-treinamento em dados de vídeo em larga escala, que ainda estão no início em comparação com a linguagem.
Prompt: figure skater performs a triple axle with a cat on her head
Com o Sora 2, estamos saltando direto para o que acreditamos poder ser o momento GPT‑3.5 para vídeo. O Sora 2 consegue fazer coisas excepcionalmente difíceis — e, em alguns casos, totalmente impossíveis — para modelos anteriores de geração de vídeo: rotinas de ginástica olímpica, saltos mortais para trás em uma prancha de stand-up paddle que modelam com precisão a dinâmica de flutuabilidade e rigidez, e triplos axels enquanto um gato se segura com todas as forças.
Prompt: a guy does a backflip
Modelos de vídeo anteriores são otimistas demais — eles transformam objetos e deformam a realidade para executar com sucesso um prompt de texto. Por exemplo, se um jogador de basquete erra um arremesso, a bola pode se teletransportar espontaneamente para a cesta. No Sora 2, se um jogador de basquete erra um arremesso, a bola vai quicar na tabela. Curiosamente, os "erros" que o modelo comete muitas vezes parecem ser erros do agente interno que o Sora 2 está modelando implicitamente; embora ainda imperfeito, ele obedece melhor às leis da física em comparação com sistemas anteriores. Essa é uma capacidade extremamente importante para qualquer simulador de mundo útil — é preciso ser capaz de modelar o fracasso, não apenas o sucesso.
O modelo também representa um grande salto em controlabilidade, sendo capaz de seguir instruções complexas em múltiplos planos, enquanto persiste com precisão o estado do mundo. Ele se destaca em estilos realistas, cinematográficos e anime.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Como um sistema de geração de vídeo e áudio de uso geral, ele é capaz de criar soundscapes de fundo sofisticadas, fala e efeitos sonoros com alto grau de realismo.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Você também pode inserir diretamente elementos do mundo real no Sora 2. Por exemplo, ao observar um vídeo de uma pessoa da nossa equipe, o modelo consegue inseri-la em qualquer ambiente gerado pelo Sora com uma representação precisa de sua aparência e voz. Essa capacidade é muito geral e funciona para qualquer humano, animal ou objeto.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
O modelo está longe de ser perfeito e comete muitos erros, mas é uma validação de que escalar ainda mais redes neurais com dados de vídeo nos aproximará de simular a realidade.
No caminho para a simulação de uso geral e sistemas de IA que possam funcionar no mundo físico, acreditamos que as pessoas podem se divertir muito com os modelos que estamos construindo ao longo do percurso.
Começamos a brincar com esse recurso de "fazer upload de si mesmo" há vários meses na equipe do Sora, e todos nós nos divertimos muito com ele. Parecia uma evolução natural da comunicação — de mensagens de texto para emojis, para mensagens de voz, e então para isso.
Por isso, hoje estamos lançando um novo app social para iOS chamado simplesmente "Sora", impulsionado pelo Sora 2. Dentro do app, você pode criar, remixar as gerações de outras pessoas, descobrir novos vídeos em um feed personalizável do Sora e inserir você ou seus amigos por meio de um recurso chamado "personagens". Com personagens, você pode se colocar diretamente em qualquer cena do Sora com fidelidade notável após uma breve gravação única de vídeo e áudio no app para verificar sua identidade e capturar sua semelhança.
Na semana passada, lançamos o app internamente para toda a OpenAI. Já ouvimos de colegas que eles estão fazendo novos amigos na empresa por causa desse recurso. Acreditamos que um app social construído em torno desse recurso de "characters" é a melhor forma de vivenciar a magia do Sora 2.
Preocupações com doomscrolling, vício, isolamento e feeds otimizados por RL estão no topo das nossas prioridades — aqui está o que estamos fazendo a respeito.
Estamos dando aos usuários as ferramentas e a flexibilidade para controlar o que veem no feed. Usando os modelos de linguagem de grande escala já existentes da OpenAI, desenvolvemos uma nova classe de algoritmos de recomendação que podem ser instruídos por meio de linguagem natural. Também contamos com mecanismos integrados para consultar periodicamente os usuários sobre seu bem-estar e oferecer proativamente a opção de ajustar o feed.
Por padrão, mostramos conteúdo com forte viés para pessoas que você segue ou com quem interage e priorizamos vídeos que o modelo considera mais prováveis de servir como inspiração para suas próprias criações. Não estamos otimizando para tempo gasto no feed, e projetamos explicitamente o app para maximizar a criação, não o consumo. Você pode encontrar mais detalhes em nossa Filosofia do feed
Este app foi feito para ser usado com seus amigos. O feedback majoritário dos testadores é que os characters são o que fazem isso parecer diferente e divertido de usar — você precisa experimentar para realmente entender, mas é uma forma nova e única de se comunicar com as pessoas. Estamos lançando isso como um app baseado em convite para garantir que você entre junto com seus amigos. Em um momento em que todas as grandes plataformas estão se afastando do grafo social, acreditamos que characters vão reforçar a comunidade.
Proteger o bem-estar dos adolescentes é importante para nós. Estamos definindo limites padrão para quantas gerações os adolescentes podem ver por dia no feed, e também estamos lançando permissões mais rígidas para characters nesse grupo. Além das nossas stacks automatizadas de segurança, estamos ampliando as equipes de moderadores humanos para analisar rapidamente casos de bullying, caso surjam. Estamos lançando controles parentais do Sora via ChatGPT para que os pais possam substituir limites de rolagem contínua, desativar a personalização algorítmica e também gerenciar configurações de mensagens diretas.
Com characters, você controla sua imagem de ponta a ponta no Sora. Só você decide quem pode usar seu character, e você pode revogar o acesso ou remover qualquer vídeo que o inclua a qualquer momento. Vídeos que contêm um character seu, incluindo rascunhos criados por outras pessoas, podem ser vistos por você a qualquer momento.
Há muitos temas de segurança que abordamos com este app — consentimento em torno do uso da imagem, proveniência, prevenção da geração de conteúdo nocivo e muito mais. Consulte nosso documento de Segurança do Sora 2 para mais detalhes.
Muitos problemas em outros apps decorrem do modelo de monetização, que incentiva decisões em desacordo com o bem-estar dos usuários. Sendo transparentes, nosso único plano atual é eventualmente dar aos usuários a opção de pagar algum valor para gerar um vídeo extra se houver demanda demais em relação à computação disponível. À medida que o app evoluir, comunicaremos abertamente aqui quaisquer mudanças em nossa abordagem, enquanto continuamos a manter o bem-estar dos usuários como nosso principal objetivo.
Estamos no começo desta jornada, mas, com todas as maneiras poderosas de criar e remixar conteúdo com o Sora 2, vemos isso como o início de uma era completamente nova para experiências cocriativas. Estamos otimistas de que esta será uma plataforma mais saudável para entretenimento e criatividade em comparação com o que está disponível hoje. Esperamos que você se divirta :)
O app Sora para iOS(abre em uma nova janela) já está disponível para download. Você pode se cadastrar no app para receber uma notificação push quando o acesso for liberado para a sua conta. Estamos iniciando hoje a implantação inicial nos EUA e no Canadá, com a intenção de expandir rapidamente para outros países. Depois de receber um convite, você também poderá acessar o Sora 2 em sora.com(abre em uma nova janela). O Sora 2 estará inicialmente disponível gratuitamente, com limites generosos para começar, para que as pessoas possam explorar livremente seus recursos, embora isso ainda esteja sujeito a restrições de computação. Usuários do ChatGPT Pro também poderão usar nosso modelo experimental Sora 2 Pro, de maior qualidade, em sora.com(abre em uma nova janela) (e em breve também no app Sora). Também planejamos lançar o Sora 2 na API. O Sora 1 Turbo continuará disponível, e tudo o que você criou continuará existindo na sua biblioteca do sora.com(abre em uma nova janela).
Modelos de vídeo estão ficando muito bons, muito rapidamente. Simuladores de mundo de propósito geral e agentes robóticos vão reformular profundamente a sociedade e acelerar a trajetória do progresso humano. O Sora 2 representa um progresso significativo em direção a esse objetivo. Em alinhamento com a missão da OpenAI, é importante que a humanidade se beneficie desses modelos à medida que eles são desenvolvidos. Acreditamos que o Sora vai trazer muita alegria, criatividade e conexão ao mundo.
— Escrito pela Equipe Sora
Alvo principal e elementos visuais - Primeira leitura: um dragão cortando o ar entre espirais de gelo serrilhadas, vórtices nas pontas das asas levantando neve soprada; segunda leitura: a placa fraturada da geleira despencando em direção a um fiorde azul-cobalto, com a borda âmbar do sol beijando a geada nas escamas; a expressão transmite calma predatória / poder sem esforço.
Formato e aparência - 5.0s; 4K; obturador de 180°; emulação de sensor digital de grande formato com microcontraste nítido; granulação muito fina; halation contida nos reflexos da neve; sem gate weave.
Lentes e filtragem - Hero: lente esférica de 50mm em plataforma aérea giroestabilizada montada no nariz (tracking paralelo com leve arco para dentro). Filtragem: Black Pro-Mist 1/8; polarizador circular ajustado de forma leve para suavizar o brilho da neve, preservando o brilho especular.
Color grading / paleta - Altas luzes: branco de gelo limpo com roll-off frio; médios: geleira azul-aço e ar ciano-claro; sombras: ardósia/azul-petróleo com detalhes preservados nas fendas; borda âmbar quente nas extremidades do dragão para separação; especulares concentrados na geada/escamas.
Iluminação e atmosfera - Sol baixo de fim de tarde como luz cruzada; vento catabático levantando neve soprada; névoa congelada fina para profundidade; rajadas intermitentes de pó de gelo no rastro; vapor de respiração sutil do dragão ao se esforçar.
Local e enquadramento - Campo de seracs imponente e crista afiada como faca; a câmera acompanha o dragão na mesma velocidade, ao lado dele, em altitude média, com diagonais da geleira conduzindo o olhar de volta ao fiorde; lâminas de gelo no primeiro plano passam perto para criar paralaxe; sem estruturas humanas.
Notas de figurino / objetos / veículo - N/A (criatura). Leitura da superfície: cristas dos chifres foscas, placas de escamas semi-iridescentes com microgeada nas bordas de ataque.
Som - Cisalhamento do vento em altitude, estrondo da membrana das asas a cada batida descendente, estalos/rangidos cristalinos do gelo nos seracs, estrondo distante da geleira se partindo; exalação/ronco rápido do dragão: "Rrhh—" (menos de 1s). Sem trilha — assombro puramente diegético.
Lista de planos otimizada (1 plano / 5.0s) - 0.0–5.0 — "Corte paralelo pela crista" (50mm, câmera aérea montada no nariz com leve arco para dentro e microaproximação) - Acompanhamos o dragão enquanto ele atravessa um corredor de espirais de gelo; vórtices nas pontas das asas transformam a neve soprada em fitas; um fragmento desprendido cai bem abaixo, levantando uma pluma de pó; a câmera se aproxima suavemente — as escamas ficam visíveis, a borda âmbar reluz — então o dragão inclina em direção ao fiorde, a cauda cortando o ar, projetando uma sombra ampla sobre a geleira.Objetivo: Entregar escala mítica com realismo tátil em uma passagem decisiva — velocidade, massa e frio elemental.
Notas de câmera (por que funciona) - A lente de 50mm equilibra a presença da criatura e a escala da paisagem sem miniaturizar; tracking paralelo + arco para dentro transmitem velocidade e forma; a microaproximação coincide com a batida descendente mais forte para pontuar a potência; o polarizador leve controla o brilho sem perder o cintilar; sol de contra/borda esculpe a silhueta; lâminas de gelo passando perto fornecem pistas de velocidade por paralaxe.
Finalização - Granulação muito fina (~15%); halation mínima nos especulares da neve; emulação de impressão suave para manter os azuis verossímeis e os pretos ricos; dinâmica multibanda para preservar o impacto da asa sem mascarar o estrondo do desprendimento da geleira; frame de pôster: dragão inclinado atravessando um serac iluminado pelo sol, neve soprada fluindo, fiorde azul-profundo brilhando ao fundo.
Sora 2
Debbie Mesloh
Caroline Zhao
Publicado em 30 de setembro de MMXXV


