OpenAI首個視頻生成模型發佈 一句話生成1分鐘高清視頻


快科技2月16日消息,OpenAI日前發佈首款文生視頻模型Sora模型,完美繼承DALLE 3的畫質和遵循指令能力其支持用戶輸入文本描述,生成一段長達1分鐘的高清流暢視頻。

該模型可以深度模擬真實物理世界,標志著人工智能在理解真實世界場景,並與之互動的能力方面實現重大飛躍。

官方公佈的生成視頻現實,以中國龍年春節為提示詞生成的視頻中,熙熙攘攘的人群中,有人在舞龍,舞龍動作相當絲滑標準,還有人舉起手機拍攝,場景細節豐富、嚴謹。

另一段都市麗人”漫步東京雨後街頭視頻中,路面上的水漬倒影細節逼真,霓虹燈光影效果堪比實景,如果不是標註說明,很多人意識不到這是由AI生成的視頻片段。

OpenAI表示,技術團隊正在教AI理解和模擬運動中的物理世界,目標是訓練模型來幫助人們解決需要現實世界交互的問題。

根據文本提示生成視頻,僅僅是整個計劃其中的一步。

目前Sora已經能生成具有多個角色、包含特定運動的復雜場景,不僅能理解用戶在提示中提出的要求,還解這些物體在物理世界中的存在方式。

不過,Sora當前也存在局限性,OpenAI稱其可能難以準確模擬復雜場景的物理原理,並且可能無法理解因果關系。

該模型還可能混淆提示的空間細節,例如混淆左右,並且可能難以精確描述隨著時間推移發生的事件,例如遵循特定的相機軌跡。

即便如此,OpenAI的首個視頻模型發佈後,不少網友驚呼:不少人要丟工作”、整個素材行業可能都會因此衰落”、語言大模型後,OpenAI又要一次加快AI進化”。

目前已有一些視覺藝術傢、設計師和電影制作人(以及OpenAI員工)獲得Sora訪問權限,他們也已開始不斷Po出新的作品,為人們展示AI生成視頻的無限創意可能。

下附OpenAI視頻模型Sora官網:https://openai.com/sora


相關推薦

2024-02-16

OpenAI周四發佈首個視頻生成模型Sora,並展示幾段效果炸裂的演示視頻。一位X用戶分享Sora生成的一名女子在東京街頭漫步的視頻,並評論稱:“OpenAI今天宣佈Sora,它使用混合擴散和變壓器模型架構生成長達1分鐘的視頻。他們似

2024-02-20

保真率、視頻時長等方面還有很大差距。根據此前報道,OpenAI前不久發佈首個視頻生成模型Sora,隻要輸入提示詞,就能生成1分鐘的高清視頻,已經被看作是改寫整個視頻生成領域的新王炸技術。據介紹,該模型能生成包含多個

2024-02-20

,從街景到行人,包括小美,在現實中根本不存在。這是OpenAI最新產品Sora制作的演示視頻,而正是這個視頻,讓周鴻禕做出AGI發展將會10倍提速的預言。傳統方式制作這樣一段1分鐘的視頻成本非常高。除需要選址,選演員,提

2024-02-18

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-18

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-17

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-17

OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂

2024-02-16

2月16日凌晨,OpenAI再次扔出一枚深水炸彈,發佈首個文生視頻模型Sora。據介紹,Sora可以直接輸出長達60秒的視頻,並且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。目前官網上已經更新48個視頻demo,在

2024-02-18

快科技2月18日消息,日前,打造ChatGPT的人工智能公司OpenAI發佈首個文生視頻模型Sora,用戶通過一句話,就能生成長達1分鐘的高清視頻。在Sora發佈後,OpenAI的估值正在大幅飆升。市場預計,在最新一輪由風投公司Thrive Capital牽頭

2022-10-08

……文本圖像生成模型超進化版你可能會覺得Make-A-Video是個視頻版的DALL·E。實際上,差不多就是這麼回事兒前面提到,Make-A-Video是文本圖像生成(T2I)模型的超進化,那是因為這個AI工作的第一步,其實還是依靠文本生成圖像。

2024-04-17

型,還在PR集成第三方視頻模型,其中就包括Runway、Pika、OpenAI的Sora等AI視頻賽道最出名的產品。目前的演示來看,Pika主要用在擴展視頻,讓場景過渡更加流暢,Sora以及Runway則主要用於為場景生成輔助鏡頭。目前Adobe已經在其Photo

2024-02-19

集等方面,有望帶來內容消費市場的發展。Sora是一種由OpenAI發佈的視頻生成模型。這種模型具有強大的視頻生成能力,可以將簡短的文本描述轉化成長達1分鐘的高清視頻。Sora模型具有三大突出亮點:能夠生成60秒長視頻並保持高

2022-10-07

上僅靠簡單描述產生各種創意動畫,這效果,直接當成一個視頻的片頭不過分吧?除應用效果出色以外,研究人員表示其中用到的一些優化技巧不光對視頻生成有效,可以泛化至一般擴散模型。具體來說,Imagen Video是一系列模型

2024-02-18

當地時間周四,OpenAI發佈首個視頻生成模型Sora,可創建長達60秒的視頻。受此消息影響,美國圖片供應商Shutterstock的股價周五大跌。一位X用戶在周五盤中發帖稱:“Shutterstock,一傢公開上市的圖片和視頻公司,在過去兩小時內