Sora 2 ist da
Unser neuestes Modell zur Videogenerierung ist physikalisch noch präziser, realistischer und besser steuerbar als bisherige Systeme. Es bietet außerdem synchronisierte Dialoge und Soundeffekte. Erstelle deine Inhalte damit in der neuen Sora-App.
Ab dem 26. April 2026 ist das Sora-Produkt nicht mehr verfügbar.
Heute veröffentlichen wir Sora 2, unser Flaggschiff-Modell für Video- und Audiogenerierung.
Das ursprüngliche Sora-Modell vom Februar 2024 war in vielerlei Hinsicht der GPT‑1‑Moment für Video – der Zeitpunkt, an dem die Videogenerierung erstmals wirklich funktionierte und einfache Eigenschaften wie Objektpermanenz durch das Hochskalieren der Pre-Training-Rechenleistung sichtbar wurden. Seitdem arbeitet das Sora-Team daran, Modelle mit noch fortschrittlicheren Fähigkeiten zur Weltsimulation zu trainieren. Wir sind überzeugt, dass solche Systeme entscheidend sind, um KI-Modelle zu trainieren, die die physische Welt wirklich verstehen. Ein wichtiger Meilenstein dafür ist das Beherrschen von Pre-Training und Post-Training mit Videodaten in großem Maßstab, einem Bereich, der im Vergleich zur Sprache noch in den Kinderschuhen steckt.
Prompt: figure skater performs a triple axle with a cat on her head
Mit Sora 2 machen wir direkt den Schritt zu dem, was wir als den GPT‑3.5‑Moment für Video betrachten. Sora 2 kann Dinge, die für frühere Videogenerierungsmodelle äußerst schwierig – und in manchen Fällen schlichtweg unmöglich – waren: olympische Turnübungen, Rückwärtssaltos auf einem Paddleboard mit realistisch nachgebildeter Auftriebs- und Steifigkeitsdynamik sowie dreifache Axel-Sprünge – während sich eine Katze verzweifelt festklammert.
Prompt: a guy does a backflip
Frühere Videomodelle sind überoptimistisch – sie verformen Objekte und die Realität, nur um einen Text-Prompt erfolgreich umzusetzen. Wenn ein Basketballspieler zum Beispiel daneben wirft, kann der Ball plötzlich wie von selbst im Korb auftauchen. In Sora 2 prallt der Ball ab, wenn ein Basketballspieler daneben wirft. Interessanterweise wirken die „Fehler“ des Modells oft wie Fehler des internen Agenten, den Sora 2 implizit nachbildet. Auch wenn es noch nicht perfekt ist, beachtet es die physikalischen Gesetzmäßigkeiten deutlich besser als frühere Systeme. Das ist eine äußerst wichtige Fähigkeit für jeden brauchbaren Weltsimulator – er muss nicht nur Erfolge, sondern auch Fehlschläge realistisch abbilden können.
Das Modell ist auch ein großer Fortschritt in Sachen Steuerbarkeit: Es kann komplexen Anweisungen über mehrere Szenen hinweg folgen und dabei den Weltzustand präzise beibehalten. Es überzeugt in realistischen, cineastischen und Anime-Stilen.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Als universelles System zur Video- und Audiogenerierung ist es in der Lage, realistische Hintergrundgeräusche, Sprache und Soundeffekte mit hoher Detailtreue zu erzeugen.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Du kannst auch direkt Elemente der realen Welt in Sora 2 einfügen. Beispielsweise kann das Modell anhand eines Videos eines Teammitglieds diese Person mit originalgetreuem Aussehen und Stimme in jede von Sora erzeugte Umgebung einfügen. Diese Fähigkeit ist sehr allgemein und funktioniert für Menschen, Tiere und Objekte gleichermaßen.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Das Modell ist noch weit von Perfektion entfernt und macht zahlreiche Fehler, doch es bestätigt, dass ein weiteres Hochskalieren neuronaler Netzwerke mit Videodaten uns der Simulation der Realität näherbringen wird.
Auf dem Weg zu universellen Simulations- und KI-Systemen, die in der physischen Welt funktionieren, sind wir überzeugt, dass Menschen mit den Modellen, die wir auf diesem Weg entwickeln, auch viel Spaß haben können.
Vor einigen Monaten haben wir im Sora-Team erstmals mit dieser „Lade-dich-selbst-hoch“-Funktion experimentiert – und wir hatten riesigen Spaß damit. Es fühlte sich an wie die natürliche Weiterentwicklung der Kommunikation – von Textnachrichten über Emojis und Sprachnachrichten bis hin zu diesem Format.
Heute starten wir eine neue soziale iOS-App namens „Sora“, die von Sora 2 betrieben wird. In der App kannst du Inhalte erstellen, die Inhalte anderer remixen, neue Videos in einem anpassbaren Sora-Feed entdecken und dich selbst oder deine Freunde über eine Funktion namens „Charaktere“ einbringen. Mit Charakteren kannst du dich mit bemerkenswerter Detailtreue direkt in jede Sora-Szene einfügen. Dafür machst du in der App einmalig eine kurze Video- und Audioaufnahme. Sie dient zur Verifizierung deiner Identität und erfasst dein Erscheinungsbild.
Letzte Woche haben wir die App intern für alle OpenAI-Mitarbeitenden gestartet. Wir haben schon von Kolleg:innen gehört, dass sie dank dieser Funktion neue Freundschaften im Unternehmen schließen. Wir sind überzeugt, dass eine soziale App rund um die „Charaktere“-Funktion der beste Weg ist, die Magie von Sora 2 zu erleben.
Sorgen über „Katastrophen-Scrolling“, Abhängigkeit, Isolation und RL-sloptimierte Feeds stehen ganz oben – so gehen wir damit um.
Wir geben den Nutzer:innen Werkzeuge und Wahlmöglichkeiten an die Hand, damit sie selbst bestimmen können, was in ihrem Feed erscheint. Mit den bestehenden großen Sprachmodellen von OpenAI haben wir eine neue Klasse von Empfehlungssystemen entwickelt, die sich mit natürlicher Sprache steuern lassen. Außerdem haben wir Mechanismen integriert, die regelmäßig das Wohlbefinden der Nutzer:innen abfragen und ihnen proaktiv die Möglichkeit geben, ihren Feed anzupassen.
Standardmäßig zeigen wir dir vor allem Inhalte von Personen, denen du folgst oder mit denen du interagierst, und priorisieren Videos, von denen das Modell annimmt, dass sie dich am ehesten zu eigenen Kreationen inspirieren. Wir optimieren nicht auf die Verweildauer im Feed, sondern haben die App ausdrücklich so entwickelt, dass sie Kreativität fördert, nicht Konsum. Weitere Details findest du in unserer Feed-Philosophie.
Diese App ist dafür gemacht, sie mit deinen Freund:innen zu nutzen. Das überwältigende Feedback der Tester:innen lautet, dass Charaktere den entscheidenden Unterschied machen und die Nutzung spannend und unterhaltsam wirken lassen. Du musst es selbst ausprobieren, um es wirklich zu verstehen – aber es ist eine neue und einzigartige Art, mit Menschen zu kommunizieren. Wir führen diese App einladungsbasiert ein, damit du direkt mit deinen Freund:innen starten kannst. In einer Zeit, in der sich alle großen Plattformen vom sozialen Beziehungsnetz entfernen, sind wir überzeugt, dass Charaktere die Gemeinschaft stärken werden.
Der Schutz des Wohlbefindens von Teenager:innen ist uns wichtig. Wir setzen standardmäßig Grenzen dafür, wie viele Generationen Teenager:innen pro Tag im Feed sehen können, und führen für diese Gruppe auch strengere Berechtigungen bei Charakteren ein. Zusätzlich zu unseren automatisierten Sicherheitssystemen bauen wir Teams menschlicher Moderatoren aus, die Fälle von Mobbing schnell überprüfen, falls sie auftreten. Wir führen die Sora-Kindersicherung über ChatGPT ein. Eltern können damit die Grenzen für endloses Scrollen anpassen, die Algorithmus-Personalisierung deaktivieren und Einstellungen für Direktnachrichten verwalten.
Mit Charakteren hast du in Sora die vollständige Kontrolle über dein Abbild von Anfang bis Ende. Nur du entscheidest, wer deinen Charakter verwenden darf. Du kannst den Zugriff jederzeit entziehen oder jedes Video entfernen, in dem er enthalten ist. Videos mit deinem Charakter, einschließlich Entwürfe, die andere erstellt haben, kannst du jederzeit einsehen.
Mit dieser App haben wir viele Sicherheitsthemen angegangen – von der Einwilligung zur Nutzung des Abbilds über Herkunftsnachweise bis hin zur Vermeidung schädlicher Inhalte und mehr. Weitere Details findest du in unserem Sicherheitsdokument für Sora 2.
Viele Probleme anderer Apps entstehen dadurch, dass ihr Monetarisierungsmodell Entscheidungen begünstigt, die dem Wohlbefinden der Nutzer:innen zuwiderlaufen. Ganz offen: Unser einziger aktueller Plan ist, den Nutzer:innen irgendwann die Möglichkeit zu geben, gegen Bezahlung ein zusätzliches Video zu generieren, falls die Nachfrage das verfügbare Rechenvolumen übersteigt. Wenn sich die App weiterentwickelt, werden wir offen über Änderungen unseres Ansatzes informieren und das Wohlbefinden der Nutzer:innen weiterhin als oberstes Ziel verfolgen.
Wir stehen am Anfang dieser Reise. Doch mit all den Möglichkeiten, Inhalte mit Sora 2 zu erstellen und zu remixen, sehen wir darin den Beginn einer völlig neuen Ära für gemeinschaftliche Kreativität. Wir sind zuversichtlich, dass dies eine gesündere Plattform für Unterhaltung und Kreativität sein wird als das, was derzeit verfügbar ist. Wir hoffen, dass du viel Spaß damit hast :)
Die Sora-iOS-App(wird in einem neuen Fenster geöffnet) ist ab sofort zum Download verfügbar. Du kannst dich in der App registrieren, um eine Push-Benachrichtigung zu erhalten, sobald dein Konto freigeschaltet wird. Heute beginnen wir mit dem ersten Rollout in den USA und Kanada, mit dem Ziel, die Verfügbarkeit schnell auf weitere Länder auszuweiten. Sobald du eine Einladung erhalten hast, kannst du auch über sora.com(wird in einem neuen Fenster geöffnet) auf Sora 2 zugreifen. Sora 2 wird zunächst kostenlos verfügbar sein, mit großzügigen Limits zum Start, damit jeder die Funktionen frei erkunden kann. Diese unterliegen jedoch weiterhin den Grenzen der verfügbaren Rechenleistung. Nutzer:innen von ChatGPT Pro können außerdem unser experimentelles, hochwertigeres Sora-2-Pro-Modell auf sora.com(wird in einem neuen Fenster geöffnet) (und bald auch in der Sora-App) verwenden. Wir planen außerdem, Sora 2 in der API verfügbar zu machen. Sora 1 Turbo bleibt weiterhin verfügbar, und alles, was du erstellt hast, bleibt in deiner Bibliothek auf sora.com(wird in einem neuen Fenster geöffnet) erhalten.
Video-Modelle werden sehr schnell immer besser. Universelle Weltsimulatoren und robotische Agenten werden die Gesellschaft grundlegend verändern und den Verlauf des menschlichen Fortschritts beschleunigen. Sora 2 bedeutet einen wichtigen Fortschritt auf diesem Weg. Im Einklang mit der Mission von OpenAI ist es wichtig, dass die Menschheit von diesen Modellen profitiert, während sie entwickelt werden. Wir glauben, dass Sora viel Freude, Kreativität und Verbundenheit in die Welt bringen wird.
– Verfasst vom Sora-Team
Primäres Ziel und Visuals
Erster Eindruck: Ein Drache, der an gezackten Eisspitzen vorbeizieht, Wirbelschleppen an den Flügelspitzen reißen Schneestaub mit. Zweiter Eindruck: Die zerbrochene Gletscherdecke stürzt in einen kobaltblauen Fjord, während der bernsteinfarbene Sonnenrand den Frost auf den Schuppen küsst. Die Ausdrucksebene vermittelt raubtierhafte Ruhe und mühelose Kraft.
Format und Look
5,0 s; 4K; 180° Shutter; Emulation eines großformatigen Digitalsensors mit präziser Mikro-Kontrastwiedergabe; sehr feines Filmkorn; dezente Halation auf Schneeglanz; kein Gate-Weave.
Objektive und Filterung
Hero: 50 mm sphärisch auf einer nasenmontierten, gyrostabilisierten Luftbildplattform (paralleles Tracking mit leichtem Bogen nach innen). Filterung: Black Pro-Mist 1/8; zirkularer Polarisationsfilter leicht eingesetzt, um Schnee-Blendungen zu reduzieren und dabei das Glitzern der Reflexe zu bewahren.
Grad und Palette
Highlights: Reines Eisweiß mit kühlem Übergang. Mitten: Stahlblauer Gletscher und blass-cyanfarbene Luft. Schatten: Schiefer/Teal mit erhaltenen Spaltendetails. Warmer bernsteinfarbener Rand an den Drachenkanten zur Abhebung. Spiegellichter klar und präzise auf Frost und Schuppen.
Beleuchtung und Atmosphäre
Spätnachmittags tief stehende Sonne im Cross-Key; katabatischer Wind wirbelt Schneestaub auf; dünner gefrorener Dunst für Tiefe; vereinzelte Eisstaubschwaden in der Spur; schwacher Atemdampf des Drachen bei Anstrengung.
Schauplatz und Bildgestaltung
Ein mächtiges Sérac-Feld und ein messerscharfer Grat; die Kamera folgt dem Drachen in mittlerer Höhe mit gleicher Geschwindigkeit, während Gletscherdiagonalen zurück zum Fjord führen; vordere Eiszacken ziehen nah vorbei und erzeugen Parallaxeneffekte; keine menschlichen Strukturen.
Kostüm-/Requisiten-/Fahrzeugnotizen
Nicht zutreffend (Kreatur). Oberfläche: matte Horngrate, halb-irisierende Schuppenplatten mit Mikro-Frost an den Vorderkanten.
Ton
Starke Windscherungseffekt in großer Höhe, Donnern der Flügelmembranen bei jedem Abschlag, kristallines Knacken und Knirschen der Séracs, fernes Donnern abkalbender Gletscher; kurzes Ausatmen und Grollen des Drachen: „Rrhh–“ (unter 1 Sekunde). Keine Musik – reine diegetische Klangkulisse voller Ehrfurcht.
Optimierte Shot-Liste (1 Shot / 5,0 s)
0,0–5,0 – „Parallel Ridge Carve“ (50 mm, nasenmontierte Luftaufnahme mit leichtem Innenbogen und Mikro-Push)
Wir halten das Tempo des Drachen, während er durch einen Korridor aus Eisspitzen gleitet; Wirbelschleppen an den Flügelspitzen reißen Schneestaub zu Bändern; ein abbrechendes Fragment stürzt weit unten herab und löst eine Pulverwolke aus; die Kamera fährt sanft näher heran – Schuppen werden sichtbar, bernsteinfarbenes Randlicht flammt auf – dann neigt sich der Drache in Richtung Fjord, schneidet mit dem Schweif durch die Luft und wirft einen weiten Schatten über den Gletscher.
Ziel: Vermittle mythische Größe mit greifbarem Realismus in einem einzigen entscheidenden Durchgang – Geschwindigkeit, Masse und elementare Kälte.
Kamera-Notizen (Warum es wirkt)
50 mm balanciert Präsenz der Kreatur und Maßstab der Landschaft, ohne zu verkleinern; paralleles Tracking plus Innenbogen vermittelt Geschwindigkeit und Form; Mikro-Push fällt mit dem stärksten Flügelschlag zusammen und setzt ein Kraftzeichen; leichter Polarisationsfilter reduziert Blendungen und erhält das Glitzern; Rücken- und Randlicht modellieren die Silhouette; knapp passierte Eiszacken liefern Parallaxe und Geschwindigkeitsreize.
Finalisierung
Sehr feines Korn (~15 %); minimale Halation auf Schneereflektionen; sanfte Print-Emulation, um Blautöne glaubwürdig und Schwarztöne satt zu halten; Multiband-Dynamik, damit der Flügelschlag präsent bleibt, ohne das Donnern des abbrechenden Gletschers zu überdecken; Posterframe: der Drache im Kurvenflug über einem sonnenbeschienenen Sérac, Schneestaub weht, dahinter leuchtet der Fjord tiefblau.
Sora 2
Debbie Mesloh
Caroline Zhao
Veröffentlicht am 30. September MMXXV


