Sora成不王炸?Meta人工智能負責人銳評:搞搞視頻就得


OpenAI日前推出的視頻生成模型Sora持續引爆相關概念,被視為視頻生成服務的重大突破。然而,來自競爭對手的科學傢卻潑一盆冷水。Sora因其視頻穩定性和清晰度而受到市場青睞,但還有一些人對其給予更高厚望,認為其或許有機會沖擊人工智能的高峰——世界模擬器,這也是OpenAI喊出的口號。

OpenAI也在其官網文章中寄望,Sora絕不僅僅是個視頻生成器,而是一個現實世界的模擬器。通過學習和模擬數據分佈,生成與真實世界相似的虛擬樣本,從而給現實世界提供預知信息。

但這一前景被Meta的首席AI科學傢Yann LeCun公開反駁,這位以直言不諱聞名的AI大佬直言:搞搞視頻就好,別吹有的沒的。

註定失敗的模擬器

LeCun在X上公開發文稱,通過生成像素來對世界進行模擬是一種資源浪費,且註定會失敗。而該貼也引發極大關註,一眾網友在評論區華山論劍。

簡單來說,LeCun認為Sora模型試圖推斷太多不相關的細節,就像是通過試圖分析足球的材料來判斷足球的運行軌跡。

他指出,生成式模型適用於文本內容,因為文本是離散的,且是由數量有限的符號組成的數據,在這種情況下,處理預測中的不確定性變得十分容易。但如果換到以像素為單位的預測領域,不確定性就會變得非常棘手,且不可能成功。

底下的網友也紛紛發言,有人稱Sora雖然令人印象深刻,但幾乎每個場景都可能出現邏輯問題,比如藝術傢測試視頻中三頭小狼莫名其妙分裂成五頭小狼。這讓模擬現實變得多少不太靠譜。

也有人說,Sora是應夢想而生,人可以做清醒的夢,或者做不太清醒的夢。這種看起來不太清醒的發言則是賭Sora有那麼一些可能實現OpenAI“世界模擬器”的壯言。

與此同時,LeCun所在的Meta上周發佈一個視頻聯合嵌入預測架構V-JEPA,據稱其通過觀看視頻來教導大模型理解和對物理世界建模,算是Sora之外,對世界模擬器的另一種嘗試。

此外,V-JEPA還可以靈活丟棄不可預測的信息,而將訓練和樣本運行效率提升1.5-6倍。不過,V-JEPA顯然顯然沒在市場引發多大動靜,相比Sora要低調很多。


相關推薦

2024-02-27

吃瓜。360 的周鴻禕在第一時間銳評:Sora 意味著實現通用人工智能的時間將縮短。緊跟時事的周鴻禕似乎對 Sora 有點上頭,從 2 月 16 號 Sora 發佈後到成稿前,他一共發佈 15 條微博,其中有 9 條都聊到 Sora ,真愛粉無疑。雖然和

2024-02-19

網友大膽猜想:“如果 Andrej 和 Ilya 創辦一傢真正開放的人工智能公司怎麼辦?”1.“我們終於知道伊爾亞看到什麼”今天,OpenAI 最新發佈的 Sora 模型再次讓人們感受到人工智能的強大,強大到令人害怕。Sora 不僅僅是一個視頻

2024-02-20

作,已成流量密碼除此之外,給真實視頻標註“該作品由人工智能Sora生成”,也成當下的流量密碼。事情的起因還得從Sora公佈當天說起,X上有一位博主發佈一段由Sora生成的維多利亞鳳冠鳩視頻,註明產生它的指令。同時在開

2024-02-22

任免決定。該公司宣佈,將立即更換事故機型737Max的項目負責人EdClark,其他負責質量和安全的高級管理人員也將被相應調整。Clark在波音已經工作近18年,曾擔任737的首席機械師和工程師,並於2021年被任命為737 Max的負責人,也

2024-02-20

周鴻禕又口出狂言。他說,“AGI(通用人工智能)的實現將從10年縮短到1年”,而背後的原因,僅僅是因為一個1分鐘的短視頻。註意看,這個女人叫小美,她正向我們走來。雖然身處日本某條熱鬧的大街,小美卻總是不停地回

2024-03-16

emo,就已經引起好萊塢和遊戲界的巨大轟動。團隊的三位負責人在最新的專訪中,對Sora進行一些介紹電影前段時間最刷屏的新聞之一,就是好萊塢大導Tyler Perry在Sora剛剛發佈一周後,取消8億美元工作室擴建計劃的消息。對此,

2024-02-19

OpenAI官網從年齡上來看,這支團隊也非常年輕,兩位研究負責人都是在2023年才剛剛博士畢業。William (Bill) Peebles於去年5月畢業,其與Saining Xie合著的擴散Transformer論文成為Sora的核心理論基礎。Tim Brooks於去年1月畢業,是DALL-E 3

2024-02-18

主要是為獲得社會大眾對它能力的反應現在,標榜要開發負責任AGI的OpenAI,應該不會冒著風險給大眾拋出一個潘多拉魔盒。參考資料:https://twitter.com/sainingxie/status/1758433679238471744https://towardsdatascience.com/explaining-openai-soras-spacetime-p

2024-02-20

鐘的高清視頻,已經被看作是改寫整個視頻生成領域的新王炸技術。據介紹,該模型能生成包含多個角色,以及特定類型運動的復雜場景,能精確生成物體和背景的細節在官網上已經更新48個視頻實例中,Sora能夠準確呈現視頻細

2024-03-13

最近,Sora團隊三位負責人露面,接受科技博主@MKBHD約16分鐘的專訪。整個視頻掐頭去尾,再除去想詞和提問的時間,透露的信息並不多,還回避訓練數據之類的敏感問題。或許因為沒有采訪經驗,他們盯著鏡頭,坐姿有些拘束,

2024-02-18

殺OpenAI的GPT-4 Turbo。百萬級別Token意味著什麼?GoogleAI項目負責人傑夫·迪恩(Jeff Dean)解釋說,在Gemini 1.5 Pro百萬級別上下文窗口支持能力下,用戶可以完成復雜的內容交互,輕松解析整本圖書、電影、播客,理解非常長的文檔

2024-02-21

AI生成的(視頻)牙齒也可以很清晰的。”另外,生成式人工智能內容檢測平臺DeepReal檢測結果顯示,梅西澄清視頻沒有明顯的AI生成技術痕跡。日前,足球解說員王濤在社交平臺發佈視頻,稱梅西澄清視頻絕對不是AI合成,隻是

2023-05-12

Meta周二(5月9日)宣佈一個新的開源人工智能(AI)模型ImageBind,該模型可以將六種類型的數據流聯系在一起。ImageBind以視覺(圖片和視頻)為核心,結合文本、聲音、3D深度、溫度、運動讀數(IMU),最終可以做到在六個模態

2024-02-22

回到去年那個“日日工業革命、夜夜文藝復興”的場景,視頻全網瘋傳,人人擔心飯碗。畢竟隻要給Sara幾句提示詞,它就能生成一段肉眼難以分辨真假的視頻。即便是圖 2 的翻車視頻,畫面效果也是足以把其他 AI 視頻前吊起來