由 2026 年 4 月 26 日起,Sora 產品已停止提供。
今日,我們正式推出 Sora 2,這是我們的旗艦影片及音訊生成模型。
2024 年 2 月推出的原版 Sora 模型,在很多方面都是影片領域的 GPT‑1 時刻:影片生成首次開始令人感覺可行,而物件恆存等簡單行為,也從擴大預訓練運算規模中浮現。此後,Sora 團隊一直專注於訓練具備更進階世界模擬能力的模型。我們相信,這類系統將對訓練能深入理解物理世界的 AI 模型至關重要。其中一個重要里程碑,是掌握大規模影片資料的預訓練及後訓練;與語言相比,這方面仍處於早期階段。
Prompt: figure skater performs a triple axle with a cat on her head
透過 Sora 2,我們正直接邁向我們認為可能屬於影片領域的 GPT‑3.5 時刻。Sora 2 能完成以往影片生成模型極難,甚至在某些情況下根本無法做到的事:奧運體操動作、在槳板上後空翻並準確模擬浮力與剛性的動態,以及一隻貓拼命抓緊時完成三周跳。
Prompt: a guy does a backflip
過往的影片模型過於樂觀,會扭曲物件和現實,以成功執行文字提示詞。例如,如果籃球員投失,籃球可能會突然傳送到籃框。在 Sora 2 中,如果籃球員投失,球會從籃板反彈。有趣的是,模型所犯的「錯誤」往往看起來像是 Sora 2 隱含建模的內部智能代理所犯的錯誤;雖然仍不完美,但與過往系統相比,模型更能遵守物理定律。對任何實用的世界模擬器而言,這都是極其重要的能力:你必須能夠模擬失敗,而不只是成功。
模型在可控性方面亦有重大躍進,能遵循橫跨多個鏡頭的複雜指示,同時準確維持世界狀態;而且在寫實、電影和動畫風格上表現出色。
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
作為通用影片音訊生成系統,Sora 2 能以高度真實感創作細緻的背景聲景、語音及音效。
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
你亦可以將現實世界的元素直接注入 Sora 2。例如,模型可透過觀察我們一位隊友的影片,將他們放入任何由 Sora 生成的環境,並準確呈現其外貌和聲音。這項能力非常通用,適用於任何人類、動物或物件。
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
模型距離完美仍有一段距離,也會犯不少錯誤,但模型驗證了在影片資料上進一步擴大神經網絡規模,將令我們更接近模擬現實。
在邁向通用模擬,以及能在物理世界中運作的 AI 系統途中,我們認為大家可以在我們沿途建立的模型中獲得很多樂趣。
幾個月前,Sora 團隊率先開始試用這項「上載自己」功能,所有人都玩得非常投入。這有點像通訊方式的自然演進:由文字訊息,到 emoji,到語音訊息,再到現在這種形式。
因此今天,我們推出一款全新的社交 iOS 應用程式,名稱就是「Sora」,由 Sora 2 驅動。在應用程式內,你可以創作、重新混合彼此的生成內容、在可自訂的 Sora 動態消息中探索新影片,並透過一項名為「角色」的功能,將自己或朋友帶入場景。透過角色,你只需在應用程式內完成一次簡短的影片及音訊錄製,用於驗證身份並擷取你的外貌,即可非常逼真地把自己直接放入任何 Sora 場景。
上星期,我們在 OpenAI 內部向所有員工推出這款應用程式。同事已經告訴我們,這項功能讓他們在公司認識到新朋友。我們認為,圍繞「角色」功能建立的社交應用程式,是體驗 Sora 2 魔力的最佳方式。
我們非常重視「沉迷滑動」(doomscrolling)、沉迷、孤立,以及由強化學習過度優化的動態消息所引發的顧慮。以下是我們的應對方式。
我們讓用戶擁有相關工具和選擇權,掌控自己在動態消息中看到的內容。透過 OpenAI 現有的大型語言模型,我們開發了一類可用自然語言指示的全新推薦演算法。我們亦內建機制,定期向用戶了解其身心狀況,並主動提供調整動態消息的選項。
預設情況下,我們會大幅偏重顯示你追蹤或互動過的人所產生的內容,並優先顯示模型認為你最有可能用作創作靈感的影片。大家花在查看動態消息的時間並非我們追逐的目標;反之,我們的應用程式設計力求啟發創作靈感,而非消耗大家的時間心力。你可以在我們的動態消息原則中查看更多詳情。
這款應用程式是為你與朋友一起使用而設。測試者在反饋意見中一致表示:「角色」的感覺與別不同,使用方式亦非常有趣,雖然必須親身嘗試才能了解到箇中究竟,但這確實是與他人溝通的獨特新方式。為確保你能與朋友一起使用,我們將以邀請形式推出此應用程式。隨著各大主要平台紛紛摒棄社交圖譜,我們認為「角色」功能將可強化社群。
保護青少年的福祉對我們非常重要。我們會預設限制青少年每日可在動態消息中看到的生成內容數量,並為這個群組推出更嚴格的角色權限。除了自動化安全系統外,我們亦正擴大人工審核團隊,以便在出現欺凌個案時快速審查。我們亦會透過 ChatGPT 推出 Sora 家長控制功能,讓家長可以操控無限捲動限制、停用個人化演算法,以及管理私訊設定。
對於角色,你可在 Sora 中全程掌控自己的肖像。只有你本人才能決定誰可使用你的出鏡角色,且可隨時撤銷存取權限或移除有你出鏡的影片。任何包含你的角色的影片,包括其他人建立的草稿,你都可隨時查看。
我們在這款應用程式中處理了大量安全議題,包括肖像使用同意、來源追溯、防止生成有害內容等。詳情請參閱我們的 Sora 2 安全機制文件。
其他應用程式的許多問題,都源自盈利模式會鼓勵作出與用戶福祉相違背的決策。顯然,我們目前唯一的計劃,是在需求遠高於可用的運算能力時,最終會讓用戶選擇支付一定費用,以額外生成影片。隨著應用程式演進,我們會公開溝通相關做法的任何變更,同時繼續以用戶福祉作為主要目標。
雖然這段旅程仍在起步階段,但透過 Sora 2 創作和重新混合內容的強大方式,我們視之為共同創作體驗全新時代的開端。我們樂觀相信,與現有平台相比,這會是一個更健康的娛樂與創意平台。希望你玩得開心 :)
Sora iOS 應用程式(在新視窗中開啟)現已可供下載。你可以在應用程式內登記,當你的帳戶獲開放存取權限時接收推送通知。我們今天首先在美國和加拿大展開初步推出,並計劃快速擴展至更多國家。收到邀請後,你亦可透過 sora.com(在新視窗中開啟) 存取 Sora 2。Sora 2 初期將免費提供,並在開始時提供寬鬆上限,讓大家自由探索其能力,不過仍會受運算資源限制。ChatGPT Pro 用戶亦可在 sora.com(在新視窗中開啟) 使用我們實驗性的更高質素 Sora 2 Pro 模型(稍後亦會在 Sora 應用程式中提供)。我們亦計劃在 API 中發佈 Sora 2。Sora 1 Turbo 將繼續提供,而你建立的一切內容都會繼續保存在你的 sora.com(在新視窗中開啟) 資料庫中。
影片模型正以極快速度變得非常出色。通用世界模擬器和機械人智能代理將從根本上重塑社會,並加速人類進步的軌跡。Sora 2 代表我們朝這個目標邁出的重大進展。秉持 OpenAI 的使命,在這些模型發展期間,確保人類能從中受益至關重要。我們相信,Sora 將為世界帶來大量喜悅、創意與連結。
— Sora 團隊撰寫
主要目標與視覺效果
第一眼看到的是一條巨龍掠過鋸齒狀冰峰,翼尖渦流捲起風雪;再細看,冰川破裂的冰層正向鈷藍色峽灣崩落,琥珀色夕陽沿龍鱗上的霜邊輕輕掠過;神情呈現掠食者般的沉著與毫不費力的力量感。
格式與觀感
5.0 秒;4K;180° 快門;模擬大畫幅數碼感光元件,呈現清晰微對比;極細顆粒;雪面高光帶有克制的暈光;無膠片門晃動。
鏡頭與濾鏡
主鏡頭:50mm 球面鏡頭,安裝於機鼻陀螺穩定航拍平台(平行追拍,略帶向內弧線)。濾鏡:Black Pro-Mist 1/8;圓形偏光鏡輕度設定,以抑制雪地眩光,同時保留鏡面閃光。
調色/色彩
高光:乾淨冰白,冷色過渡;中間調:鋼藍色冰川與淡青色空氣;陰影:板岩/藍綠色,保留冰隙細節;龍身邊緣帶暖琥珀色輪廓光,突出主體;霜面/鱗片上的鏡面高光收緊。
光線與氣氛
午後低角度陽光作交叉主光;下坡風捲起風雪;薄薄冰霧營造縱深;尾流間歇帶起冰塵;巨龍用力時帶出淡淡呼氣霧氣。
地點與構圖
高聳冰塔群與刀鋒般的山脊線;攝影機在中高度與巨龍等速並行追拍,冰川對角線一路引向峽灣;前景冰棱近距離掠過,形成視差;沒有任何人類建築。
服裝/道具/載具備註
不適用(生物)。表面觀感:啞面角脊,半虹彩鱗甲,前緣帶微霜。
聲音
高空風切聲、每次振翼時翼膜如雷鳴般震響、冰塔發出水晶般的細碎敲擊與裂響、遠處冰川崩解的轟鳴;巨龍短促呼氣/低吼:「嗚呀」(少於 1 秒)。無配樂,只保留場景內聲音帶來的震撼。
優化鏡頭清單(1 個鏡頭/5.0 秒)
0.0–5.0—「平行山脊掠行」(50mm、機鼻航拍,略帶向內弧線與細微推近)
我們與巨龍同步前進,看牠穿越冰峰走廊;翼尖渦流將風雪捲成絲帶;遠處下方一塊冰崩碎片墜落,揚起粉雪煙柱;攝影機輕輕靠近,鱗片細節浮現,琥珀色輪廓光一閃;隨後巨龍轉向峽灣,尾巴如剪刀般掠動,在冰川上投下橫掃而過的陰影。目的:以單一鏡頭掠過,呈現神話般的尺度與觸手可及的真實感:速度、重量與極寒元素。
攝影備註(為何畫面成立)
50mm 能平衡生物存在感與景觀尺度,而不會令場景顯得微縮;平行追拍配合向內弧線,能呈現速度與形態;細微推近與最強下拍同步,強化力量節點;輕度偏光鏡控制眩光,同時保留閃爍感;背光/輪廓光刻劃剪影;近距離擦過的冰棱提供視差速度線索。
後期處理
極細顆粒(約 15%);雪面鏡面高光的暈光降至最低;輕柔印片模擬,讓藍色可信、黑位飽滿;多頻段動態處理保留振翼低頻衝擊,同時不掩蓋冰崩轟鳴;海報畫面:巨龍斜掠過被陽光照亮的冰塔,風雪流動,遠處峽灣閃耀深藍。
Sora 2
Debbie Mesloh
Caroline Zhao
於 2025 年 9 月 30 日發佈


