自 2026 年 4 月 26 日起,Sora 產品已停止提供。
Sora 2 今天正式推出,這是我們的旗艦影音生成式模型。
初代 Sora 模型於 2024 年 2 月推出時,堪稱影片界的 GPT‑1 里程碑:這是影片生成技術首次展現可行性,並且隨著預訓練運算規模的擴大,開始出現「物體恆存」等基本行為。自此,Sora 團隊專注於訓練具備更高階模擬世界能力的模型。我們相信,要訓練 AI 模型深入理解現實世界,這類系統扮演著關鍵角色。一個重要的里程碑是掌握對大規模影片資料進行預訓練與後訓練,而相較於語言,這仍處於初期階段。
Prompt: figure skater performs a triple axle with a cat on her head
在我們看來,Sora 2 的問世,就如同直接跳到影片界的 GPT‑3.5 里程碑。Sora 2 能完成對前代影片生成模型而言極其困難,甚至在某些情況下根本不可能做到的事:奧運體操編排動作、在立槳板上後空翻以精準模擬浮力與剛性的動態,以及在貓咪死命抱住不放的情況下完成三周半跳。
Prompt: a guy does a backflip
先前的影片模型往往過於樂觀,為了執行提示詞,會將物體變形或扭曲現實。舉例來說,如果籃球員投籃失敗,球可能會瞬間傳送到籃框裡。在 Sora 2 中,當籃球員投籃失敗,球會自然打到籃板而反彈。有趣的是,模型所犯的「錯誤」常常像是 Sora 2 進行隱式建模的內部智慧體出錯;雖然還不完美,但相較於前代系統,在遵循物理規律方面的表現更好。這對任何實用的世界模擬器來說,都是至關重要的能力:必須能模型失敗情境,而不僅僅是呈現成功場景。
這款模型在可控性方面也有重大突破,能夠執行跨多個鏡頭的複雜指令,並精準維持世界狀態的連貫性。無論是寫實、電影感或動畫風格,模型都能完美駕馭。
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
這是一套通用影音生成系統,可打造高度擬真的精緻背景聲場、語音和音效。
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
你可以將真實世界的元素直接注入 Sora 2 中。例如,模型只要觀察我們其中一位組員的影片,就能精準捕捉該組員的樣貌與聲音,並融入任何 Sora 產生的場景中。這項功能非常通用,適用於任何人類、動物或物體。
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
這款模型雖然離完美狀態還有很大差距,且會犯許多錯誤,但這證明了只要持續擴大視訊資料的神經網路規模,我們將能更接近模擬現實。
在邁向能在現實世界中運行的通用模擬和 AI 系統的旅途中,我們認為人們可以在我們沿途構建的模型中獲得很多樂趣。
幾個月前,我們在 Sora 團隊率先開始試玩這項「上傳本人」功能,大家都玩得不亦樂乎。感覺就像溝通方式的自然演進,從文字訊息到表情符號,再到語音訊息,如今演變成這個全新體驗。
今天,我們正式推出一款名為「Sora」的全新 iOS 社交應用程式,由 Sora 2 提供技術支援。在這款應用程式中,你可以製作、重新混編彼此的創作、在可自訂的 Sora 動態牆上探索新影片,並透過名為「角色」的功能將自己或朋友融入影片中。透過「角色」功能,只需在應用程式中完成一次簡短的影音錄製,驗證身分並擷取你的肖像,就能以極高擬真度直接將自己放入任何 Sora 場景中。
上週,我們向 OpenAI 全體內部人員推出了這款應用程式。我們已經聽到許多同仁透過這項功能在公司交到新朋友。我們認為,以「角色」功能為核心的社交應用程式,是體驗 Sora 2 魔力的最佳方式。
針對人們最關心的問題,包括無止境捲動、成癮、社交隔離,以及經強化學習演算法調整的推薦內容 (RL-sloptimized feed),我們提出以下解決方案:
我們提供工具和選項,讓使用者可以掌控動態牆上顯示的內容。我們運用 OpenAI 現有的大型語言模型,開發出一套全新類別的推薦演算法,可遵循自然語言指令。我們設置了內建機制,定期調查使用者的身心健康情況,並主動提供調整動態牆內容的選項。
預設情況下,我們會顯示與你追蹤或互動的對象高度相關的內容,並優先推薦模型認為最能激發你創作靈感的影片。我們的目標不是把使用者留在動態牆上更久,這款應用程式的設計理念十分明確:盡可能協助創作,而非消費內容。更多詳細資訊請參考我們的動態牆理念
這款應用程式的設計初衷,是供你與朋友一起使用。測試者幾乎一致反映,角色正是讓這項體驗感覺與眾不同且使用起來充滿樂趣的關鍵,必須親自試用才會真正理解,但這是一種與人溝通的全新且獨特方式。我們將以邀請制推出這款應用程式,確保你能和朋友一起加入。如今各大主流平台的社交圖譜作用都逐漸淡化,我們認為角色將能重新鞏固社群連結。
守護青少年的身心健康對我們而言非常重要。針對青少年用戶,我們為每日可瀏覽的動態牆內容數量設置了預設上限,並推出更嚴格的角色權限規範。除了自動化安全機制外,我們也擴大人工審查團隊的規模,以便在出現霸凌事件時能快速審查。我們將透過 ChatGPT 推出 Sora 家長控制功能,讓家長能覆寫無限捲動限制、停用演算法個人化,並管理私訊設定。
有了「角色」功能,在 Sora 中,你能完全掌控自己的肖像。只有你本人可以決定誰有權使用你的角色,而且可以隨時撤銷權限,或是移除任何包含該角色的影片。包含你的角色的影片,包括其他人建立的草稿,你隨時都可以查看。
我們在這個應用程式中針對許多安全議題下了功夫,例如肖像使用同意授權、來源追溯、防止產生有害內容等。詳情請參閱我們的Sora 2 安全性說明文件。
其他應用程式發生的很多問題,都是因為受制於營利模型,做出與使用者福祉背道而馳的決定。而我們開誠布公,目前只有一個計畫,就是未來當需求超過可用的運算資源時,會提供選項讓用戶付費加購額外的影片產生額度。隨著應用程式不斷演進,我們會在此公開說明我們做法的任何變更,同時持續以使用者福祉為主要目標。
我們的旅程才剛開始,但憑藉 Sora 2 強大的創作與內容混編能力,我們認為這是共同創作體驗全新時代的開端。我們對此抱持樂觀態度,認為這將成為一個比現有平台更健康的娛樂與創作平台。希望你玩得愉快 :)
Sora iOS 應用程式(在新視窗中開啟)現已可供下載。你可以在應用程式內註冊,當你的帳戶開放使用時會收到推播通知。我們今天在美國和加拿大開始初步推行,並計劃迅速擴展到其他國家。收到邀請後,你也可以透過sora.com(在新視窗中開啟)使用 Sora 2。Sora 2 初期將免費提供,並設有寬鬆的使用限制,以便人們自由探索其功能,但仍受計算限制。ChatGPT Pro 使用者也可以在 sora.com(在新視窗中開啟) 上使用我們實驗性質且品質更高的 Sora 2 Pro 模型,並且很快也能在 Sora 應用程式中使用。我們也計劃在 API 中推出 Sora 2。Sora 1 Turbo 將繼續提供使用,你創建的所有內容將繼續保存在你的sora.com(在新視窗中開啟)資料庫中。
影片模型正以非常快的速度變得非常出色。通用世界模擬器和機器人智慧體的出現,將徹底改變社會結構,並加快人類發展進程。Sora 2 正是朝這個目標邁進的重大里程碑。秉持 OpenAI 的使命,確保這些模型在發展的過程可造福人類,對我們至關重要。我們深信,Sora 將為世界帶來大量歡樂體驗、創意靈感及人際連結。
— Sora 團隊撰文
主要目標與視覺
第一眼印象:一隻巨龍掠過鋸齒般的冰刺,翅膀尖端捲起雪霧漩流;仔細觀察的細節:冰川破碎的冰層崩裂,落入鈷藍色的峽灣,琥珀色陽光邊緣輕吻著龍鱗上的冰霜;表情呈現掠食者般的鎮定與游刃有餘的力量感。
格式與視覺風格
5.0 秒;4K;180° 快門;模擬大尺寸數位感光元件,呈現細微銳利對比;極細膩的顆粒感;雪地閃光處的光暈有所克制;沒有畫面微晃效果。
鏡頭與濾鏡
主鏡頭:50mm 球面鏡頭,安裝於機頭的陀螺儀穩定空拍平台上(平行跟拍,移動軌道略帶向內弧度)。濾鏡:Black Pro-Mist 1/8;圓偏光鏡輕度設定以壓低雪地刺眼反光,同時保留鏡面高光的閃亮感。
色彩分級/調色盤
高光:純淨的冰白色,帶冷色調柔和過渡;中間調:鋼藍色冰川與淡青色空氣感;陰影:石板色/藍綠色,保留冰隙細節;龍身邊緣加上暖琥珀色輪廓光,以強化分離感;冰霜/鱗片上的鏡面高光集中且銳利。
光線與氛圍
近黃昏的低角度陽光交叉主光;下坡風捲起雪霧;淡淡的冰霧增添景深;尾流中間歇揚起冰塵;龍在使力時吐出隱約的呼氣霧氣。
位置與構圖
高聳的冰塔群和如刀鋒般銳利的山脊線;鏡頭保持在中高度,與龍同步跟拍,冰川呈斜線延伸至峽灣;前景的冰翼貼近鏡頭掠過,營造視差效果;沒有任何人造建築。
服裝/道具/交通工具備註
不適用(生物)。表面觀感:霧面角脊、帶半虹彩光澤的鱗板,前緣帶有微細霜晶。
聲音
高空風切聲,翅膀薄膜每次下拍都隆隆作響,冰塔傳來清脆的冰裂聲與嘎吱聲,遠方冰川崩落傳來巨響;龍急促的吐息與低吼聲:「嗚啊」(不到 1 秒)。沒有配樂,純粹呈現場景聲音。
最佳化鏡頭列表 (1 顆鏡頭/5.0 秒)
0.0–5.0—「平行切入山脊」(50mm,安裝在機頭的空拍鏡頭,移動軌道帶一點向內弧度並微幅推進)
鏡頭與龍並行,跟著牠穿梭於冰刺廊道之間;翼尖渦流將風捲雪撕扯成帶狀;一塊崩裂的冰川碎片墜向遠下方,揚起一股粉雪煙柱;鏡頭緩緩貼近——鱗片細節清晰可辨,琥珀色邊緣光乍亮——接著龍朝峽灣傾斜轉向,尾巴剪動,在冰川上投下橫掃而過的巨大陰影。目的:用一個果斷的鏡頭呈現神話級磅礡氣勢,同時帶有可觸摸般的真實質感:速度、重量與自然元素的冰冷感。
鏡頭筆記(為何畫面成立)
50mm 鏡頭既能展現龍的存在感,也能保留景色的壯闊感,而不會讓主角顯得縮小;平行跟拍+向內移動弧度可強化速度感和龍的身形;瞄準龍最強勁的拍翅下壓動作微幅推進,帶來加強力道的效果;偏光鏡可壓低刺眼的反光,同時保留閃閃發亮的質感;背光/輪廓光太陽能勾勒出剪影;在前景貼近掠過的冰翼可帶來視差速度線索。
後製收尾
非常細緻的顆粒 (約 15%);雪地的反光幾乎沒有光暈;用柔和的沖印模擬手法讓藍色顯得自然、黑色顯得飽滿;對音訊進行多頻段動態處理,保留拍動翅膀的隆隆作響聲,而不會覆蓋掉冰川崩落的巨響;定格畫面:龍掠過陽光灑落的冰塔,雪霧飛揚,遠方的峽灣閃爍著湛藍光芒。
Sora 2
Debbie Mesloh
Caroline Zhao
發佈時間:2025 年 9 月 30 日


