OpenAI 推出文本到視頻人工智能模型 Sora


OpenAI正在推出一種新的視頻生成模型,它的名字叫Sora。這傢人工智能公司稱,Sora"可以根據文字說明創建逼真而富有想象力的場景"。文本到視頻模式允許用戶根據自己編寫的提示創建長達一分鐘的逼真視頻。

tokyo_walking.webp

根據 OpenAI 的介紹博文,Sora 能夠創建"具有多個角色、特定運動類型以及主體和背景準確細節的復雜場景"。該公司還指出,該模型能夠理解物體"在物理世界中的存在方式",還能"準確解釋道具並生成表達生動情感的引人註目的角色"。

該模型還能根據靜態圖像生成視頻,以及在現有視頻中填充缺失的幀或擴展視頻。OpenAI 的博文中包含的 Sora 生成的演示包括淘金熱時期加利福尼亞州的空中場景、從東京火車內部拍攝的視頻等。許多演示都有人工智能的痕跡--比如在一段博物館的視頻中,地板疑似在移動。OpenAI 表示,該模型"可能難以準確模擬復雜場景的物理現象",但總體而言,演示結果令人印象深刻。

幾年前,像 Midjourney 這樣的文本到圖像生成器在模型將文字轉化為圖像的能力方面處於領先地位。但最近,視頻技術開始飛速進步:Runway 和 Pika 等公司都展示自己令人印象深刻的文字轉視頻模型,而Google的 Lumiere 也將成為 OpenAI 在這一領域的主要競爭對手之一。與 Sora 類似,Lumiere 也為用戶提供文字轉換視頻的工具,還能讓用戶通過靜態圖像創建視頻。

圖片.png

Sora 目前隻對"紅隊"人員開放,他們負責評估模型的潛在危害和風險。OpenAI 還向一些視覺藝術傢、設計師和電影制片人提供訪問權限,以獲得反饋意見。它指出,現有模型可能無法準確模擬復雜場景的物理現象,也可能無法正確解釋某些因果關系。

本月早些時候,OpenAI 宣佈將在其文本到圖像工具 DALL-E 3 中添加水印,但指出這些水印"很容易去除"。與其他人工智能產品一樣,OpenAI 將不得不面對人工智能逼真視頻被誤認為是真實視頻的後果。


相關推薦

2024-02-16

景視角下,這隻蜥蜴細節拉滿:OpenAI表示,公司正在教授人工智能理解和模擬運動中的物理世界,目標是訓練出能夠幫助人們解決需要與現實世界互動的問題的模型。在此,隆重推出文本到視頻模型——Sora。Sora可以生成長達一

2024-02-18

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-18

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-17

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-17

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-03-23

會發生什麼。別忘AI依然是好萊塢的爭議話題不可否認,人工智能已經成為影視行業的難以割舍的一部分,許多前期、後期工序都已經離不開這種新興工具。與此同時,插畫師、配音演員與AIGC有關的失業潮,也不免引發從業者的

2024-03-14

3月14日消息,美國當地時間周三,人工智能初創公司OpenAI的首席技術官米拉·穆拉蒂(MiraMurati)接受媒體記者專訪。在采訪中,她談到該公司最新文本轉視頻工具Sora,這款產品預計將於今年晚些時候向公眾發佈,同時還會添加

2024-02-23

2月23日消息,OpenAI人工智能模型Sora在上周發佈後,好萊塢並未表現出特別恐慌。Sora的亮相再次激發關於人工智能如何改變娛樂產業的討論,主要因為該模型能夠根據文字提示迅速生成相對高質量的視頻。不過Sora和其他一些圍繞

2024-04-07

》報道,OpenAI和Google利用從YouTube視頻中轉錄的文本訓練人工智能模型,這可能侵犯創作者的版權。該報道引述許多解這些公司做法的人士的話,描述OpenAI、Google和Meta為最大限度地向其人工智能提供數據所做的努力。就在幾天前

2024-02-16

今日凌晨,OpenAI推出其首款文生視頻大模型Sora。該模型能根據提示詞生成長達1分鐘的視頻,或者擴展生成的視頻使其更長,同時視覺質量相當驚艷。相比以往的視頻模型,Sora的亮點非常明顯,不僅對文本理解更深刻,可以準確

2024-02-19

2月16日,OpenAI的AI視頻模型Sora炸裂出道,生成的視頻無論是清晰度、連貫性和時間上都令人驚艷,一時間,諸如“現實不存在!”的評論在全網刷屏。Sora是如何實現如此顛覆性的能力的呢?這就不得不提到其背後的兩項核心技

2024-02-26

Sora,已經成為人工智能界的開年“王炸”。2月16日,OpenAI發佈Sora大模型,僅需通過文本即可自動生成視頻,這也是繼文本模型ChatGPT和圖片模型Dall-E之後,又一極具顛覆性的大模型產品。文本生成視頻並非始於Sora。據不完全統

2024-05-06

反而覺得它讓他們的工作變得更加遊刃有餘。今年2月,人工智能初創公司OpenAI正式推出Sora,這款工具旨在“深入理解和模擬變化中的現實世界”。Sora以其獨特的文本到視頻轉換技術而聞名,能夠生成長達一分鐘的高質量視頻,

2024-02-16

OpenAI的文生視頻模型Sora刷屏。它有多震撼呢?這麼說吧,上一次這麼瘋狂的刷屏可能還是人類第一次見到ChatGPT的時候。以及,Sora之前幾小時Google剛剛推出它最強的LLMGemini1.5,並試圖宣稱自己終於殺死GPT-4,然而,顯然現在沒人