OpenAI的Sora視頻生成模型也能用來渲染視頻遊戲


OpenAI新推出的首個視頻生成模型-視頻生成模型索拉(Sora)可以完成一些真正令人印象深刻的影片生成壯舉。不過,至少從今天晚上發表的一篇技術論文來看,這個模型比OpenAI最初想象的還要厲害。

Screenshot_2024-02-15_at_8.00.07-PM-transformed.webp

這篇題為《作為世界模擬器的視頻生成模型》(Video generation models as world simulators)的論文由多位 OpenAI 研究人員共同撰寫,揭開 Sora 架構關鍵方面的神秘面紗--例如,Sora 可以生成任意分辨率和長寬比(最高 1080p)的視頻。根據論文所述,Sora 能夠執行一系列圖像和視頻編輯任務,從創建循環視頻、向前或向後延伸視頻到更改現有視頻的背景。

但最吸引筆者的還是 Sora"模擬數字世界"的能力,OpenAI 的合著者如是說。在一次實驗中,OpenAI 將 Sora 放到 Minecraft 上,讓它在控制玩傢的同時渲染世界及其動態(包括物理)。

Sora 在 Minecraft 中控制一名玩傢,並渲染視頻遊戲世界,請註意,顆粒感是由視頻到 GIF 的轉換工具造成的,而不是 Sora。圖片來源:OpenAIOpenAI

那麼,Sora 是如何做到這一點的呢?正如 NVIDIA 高級研究員 Jim Fan(通過 Quartz)所說,與其說 Sora 是一個創意引擎,不如說它是一個"數據驅動的物理引擎"。它不僅能生成單張照片或視頻,還能確定環境中每個物體的物理特性,並根據這些計算結果渲染照片或視頻(或交互式 3D 世界,視情況而定)。

合著者寫道:"這些功能表明,繼續擴展視頻模型是開發物理和數字世界以及其中的物體、動物和人的高能力模擬器的一條大有可為的途徑。"

現在,Sora在視頻遊戲領域也有其通常的局限性。該模型無法準確模擬玻璃碎裂等基本互動的物理過程。即使在可以建模的互動中,Sora 也經常出現不一致的情況,例如在渲染一個人吃漢堡時,卻無法渲染漢堡上的咬痕。

不過,如果我沒看錯的話,Sora 似乎可以為更逼真(甚至可能是逼真)的程序生成遊戲鋪平道路。這既令人興奮,又令人恐懼(考慮到Deepfake的影響)--這也許就是為什麼 OpenAI 選擇暫時將 Sora 關在一個非常有限的訪問程序後面的原因。


相關推薦

2024-02-18

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-18

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-17

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-17

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-26

Sora,已經成為人工智能界的開年“王炸”。2月16日,OpenAI發佈Sora大模型,僅需通過文本即可自動生成視頻,這也是繼文本模型ChatGPT和圖片模型Dall-E之後,又一極具顛覆性的大模型產品。文本生成視頻並非始於Sora。據不完全統

2024-03-16

最近,OpenAICTOMurati接受采訪時,對Sora訓練數據語焉不詳、支支吾吾的表現,已經成全網熱議的話題。畢竟,要是一個處理不好,OpenAI就又要陷入巨額賠償金的訴訟之中。前幾天Murati接受華爾街日報采訪時,被問及Sora訓練數據的

2024-02-16

今日凌晨,OpenAI推出其首款文生視頻大模型Sora。該模型能根據提示詞生成長達1分鐘的視頻,或者擴展生成的視頻使其更長,同時視覺質量相當驚艷。相比以往的視頻模型,Sora的亮點非常明顯,不僅對文本理解更深刻,可以準確

2024-03-13

經驗,他們盯著鏡頭,坐姿有些拘束,YouTube 網友評價:OpenAI 的采訪給人的感覺,就像旁邊有個拿著槍的律師。采訪得到最為明確的信息是,Sora 短期內不會向公眾開放。另外,他們也談到 Sora 的原理、優缺點、發展路線、安全

2024-04-16

一表示,將允許用戶在其旗下的視頻編輯軟件中使用包括OpenAI的Sora在內的第三方生成式人工智能工具。Adobe的PremierePro軟件廣泛應用於電視和電影行業。該公司稱,該項目目前正處於初期階段,並計劃在今年對軟件增添基於人工

2024-02-18

,不僅要解讀出畫面的元素,還要解讀出一些物理定律。openAI的論文中曾提到recaptioning技術,意思是對每一幀畫面都能夠用文字來描述。這點也正符合人類認知世界的方法。3、openAI產生很多3D內容。不排除它用現在遊戲引擎做很

2024-02-18

出招。兩個AI巨頭在同一天各自放出自己的AI新核武器,OpenAI的文生視頻模型Sora又一次贏得滿堂彩。Sora的驚艷亮相,不僅碾壓諸多AGI視頻同行,更有可能改變電影電視廣告遊戲行業的未來遊戲規則。Google新模式性能完勝周四,Goo

2024-03-08

主要領域。目前,視頻正成為人們關註的焦點,尤其是 OpenAI 在上個月推出 Sora,它可以制作逼真的 60 秒 1080p 短片。不出所料,人工智能生成的視頻並不完美,但它代表該技術的重大飛躍。

2024-05-01

末的 VideoPoet,視頻生成模型進入到加速階段。2024年2月,OpenAI 旗下視頻生成模型 Sora 正式對外發佈。Sora 一名源於日文“空”(そら sora),取自天空之意,以示其無限的創造潛力。與 Runway、Pika、VideoPoet 等“前輩”相比,Sora

2024-02-18

密時空Patches,竟是來自GoogleDeepMind和謝賽寧的論文成果。OpenAI,永遠快別人一步!像ChatGPT成功搶Claude的頭條一樣,這一次,Google核彈級大殺器Gemini1.5才推出沒幾個小時,全世界的目光就被OpenAI的Sora搶去。100萬token的上下文,僅